Internetdienste
Das Internet ist ein Transportmedium für digitale Daten, und gelegentlich wird es als "Daten-Autobahn" bezeichnet. Dieses Bild trifft es recht genau: So wie das Straßennetz vorhanden sein muss, wenn der Verkehr fließen soll, schafft das Internet die notwendigen Voraussetzungen für den weltweiten Datenaustausch. Allerdings ist damit noch nicht festgelegt, welche Daten transportiert werden können. Um im Bild zu bleiben: Es ist noch nicht darüber entschieden, welche LKWs auf unserer Autobahn nach welchen Verkehrsregeln fahren und welche Art von Waren sie transportieren.
Dies wird durch die Dienste geregelt, die auf dem Internet aufsetzen. Ein Anwenderprogramm, das Datenübertragung über das Internet benutzen will, muss als Client agieren: es muss eine Dienstleistung von einem entsprechenden (in der Regel weit entfernten) Server anfordern. Die Kommunikation zwischen Client und Server wird dabei über ein Protokoll abgewickelt, das für den jeweiligen Dienst charakteristisch ist und den Ablauf der Kommunikation regelt. Die folgende Tabelle zeigt einige Internet-Dienste und zugehörige Protokolle:
WWW
|
Informationsangebot: Dokumente im HTML-Format, die Texte und Bilder sowie Verweise auf andere HTML-Dokumente, aber auch auf beliebige andere Dateien enthalten können; durch entsprechende Programmierung sind auch interaktive Dokumente möglich, die auf Benutzereingaben reagieren ("aktive Seiten"). |
HTTP
|
|
|
Elektronische Post: der Absender schreibt einen Brief und sendet ihn über das Internet zu einem "digitalen Postfach" des Empfängers. Dieser kann dann die dort lagernden Briefe auf seinen lokalen Rechner holen. Um die Beschränkung auf Texte zu umgehen, können einer E-Mail beliebige andere Dateien "angehängt" werden. |
z.B. SMTP + POP3
|
|
FTP |
Übertragung von Dateien: Je nach Übertragungsrichtung unterscheidet man zwischen "Upload" (Dateien von meinem lokalen Rechner zu einem entfernten Computer senden) und "Download" (Dateien von einem entfernten Computer auf meinen lokalen Rechner holen). |
FTP
|
|
Time |
Zeiteinstellung: Für viele Anwendungen (z.B. automatische Updates) ist es wichtig, dass alle Computer mit exakt der gleichen Uhrzeit arbeiten. Dafür liefert ein SNTP-Server eine hochgenaue Uhrzeit. |
SNTP
|
|
Domain Name System |
Übersetzung von Domain-Namen in IP-Adressen: Werden vom Anwender statt IP-Adressen Domain-Namen eingegeben, müssen diese erst in IP-Adressen übersetzt werden. Diese Aufgabe leisten die DNS-Server. |
DNS-Protocol |
Da das Internet laufend weiterentwickelt wird, ist damit zu rechnen, dass in Zukunft noch weitere Dienste eingerichtet werden. Es ist natürlich nicht möglich, hier alle Internetdienste zu beschreiben. Es werden hier daher nur zwei Dienste (WWW und E-Mail) und das für viele Dienste notwendige Domain Name System beschrieben.
World Wide Web
Der wohl bekannteste Internet-Dienst ist WWW, das "World Wide Web". Das zugehörige Protokoll nennt sich HTTP, was ein Akronym für "HyperText Transport Protocol" ist. Ein Programm, das HTTP verwendet, um Web-Seiten anzufordern, ist also ein "WWW-Client". Üblicherweise nennt man ein solches Programm einen "Browser" (engl. to browse = schmökern). Der bekannteste und am weitesten verbreitete Browser ist der Internet-Explorer (IE) von Microsoft. Diese Eigenschaften machen ihn allerdings zum einem bevorzugten Ziel von Hackerangriffen. Andere Firmen bieten Alternativen zum Internet Explorer, wie z.B. Firefox, Google Chrome oder Opera.
Der zugehörige HTTP-Server wird gewöhnlich einfach als "Web-Server" bezeichnet. In aller Regel ist dies ein Rechner, auf dem viele "Web-Seiten" gespeichert sind. Wie schon oben erwähnt, sind Web-Seiten Dokumente im HTML-Format. Damit der Client nun genau angeben kann, welche der zahlreichen HTML-Seiten er haben will, erhält jede Seite eine eindeutige Adresse:
z.B. http://www.gkinf.de/netze/internet.html
Eine so geformte Adresse nennt man einen "Universal Ressource Locator" oder kurz eine URL (was üblicherweise als Femininum verwendet wird). Eine URL ist aus vier Bestandteilen zusammengesetzt:
http:// |
Als erstes wird das zu verwendende Protokoll genannt. |
www.gkinf.de |
Sodann wird die Internet-Domain angegeben, auf der die gewünschte Seite lagert. |
/netze/ |
Es folgt der Pfad auf dem Server bzw. der Ordner, in dem das gewünschte Dokument liegt. |
internet.html |
Abschließend wird der Dateiname des Dokuments angegeben. |
Es sind nicht alle dieser Angaben immer unbedingt nötig:
-
Wenn z.B. am Ende der URL der Dateiname fehlt und die URL mit dem Pfad aufhört, dann wird in diesem Ordner nach einem "Standard-Dokument" namens „index.htm", „index.html" oder „index.php“ gesucht. Wird kein solches Dokument gefunden, dann wird üblicherweise das Inhaltsverzeichnis dieses Ordners zurückgeliefert.
-
Die meisten modernen Browser tolerieren es auch, wenn die einleitende Dienste-Angabe (http://) fehlt. Ist kein Dienst angegeben, wird HTTP als Standard angenommen.
Warum wird dann überhaupt ein Dienst angegeben? Nun, die meisten Browser können nicht nur HTTP, sondern auch FTP, und es gibt viele FTP-Server im Internet, auf die man mit dem Browser zugreifen kann (zumindest lesend!). In diesem Fall ist dann aber die Angabe des Dienstes "ftp://" am Anfang der URL unbedingt erforderlich!
ftp://meinftpsever.net, bzw. ftp://username@meinftpserver.net (mit Benutzeranmeldung)
Wenn der username existiert, erscheint eine Anmeldemaske, in der man das Passwort eingeben muss.
HTML-Dokumente können nach den eigenen Wünschen mit Schriftarten, Schriftgrößen, Schriftfarben und natürlich auch eingebetteten Bildern gestaltet werden 1. Die wichtigste Eigenschaft von HTML-Dokumenten im "Web" sind aber die "Links" (engl. to link = verbinden): jedes Dokument kann Verweise auf andere Dokumente, ja sogar beliebige andere Dateien enthalten.
Wie alle HTML-Formatanweisungen wird auch ein Link mit Hilfe eines entsprechenden "Tags" dargestellt:
<a href="https://www.suso.schulen.konstanz.de">Suso-Gymnasium</a>
Unter href kann eine beliebige URL angegeben werden. Liegt das Verweisziel auf dem gleichen Web-Server, kann die Angabe einer Domain entfallen und nur der Dateiname des Dokumentes (samt Pfad) angegeben werden.
Durch die Verweise auf weitere Dokumente entsteht ein Verbund aus vielen Dokumenten, die untereinander verlinkt sind. Dies bezeichnet man als Hypertext-Struktur. Topologisch gesehen handelt es sich hier um einen vermaschten Graphen, bei dem die einzelnen Dokumente die Knoten und die Links gerichtete Kanten darstellen. Damit haben das Internet (die Computer und ihre physikalischen Leitungen) und das WWW (die Dokumente und ihre Links) die gleiche zugrunde liegende Struktur, aber die Bedeutung der Knoten und Kanten ist eine völlig andere.
Protokollierung
Jeder Computer im Internet wird durch seine IP-Adresse identifiziert. Wenn man zuhause mit einem DSL-Anschluss oder mobil mit einem Smartphone ins Internet geht, erhält man vom Provider eine IP-Adresse zugewiesen. Der Provider hat einen Adressbereich, aus dem er Adressen verteilen kann. Diese IP-Adresse ist bis zum Trennen der Verbindung 2 gültig, beim nächsten Verbinden wird höchstwahrscheinlich eine neue IP-Adresse zugewiesen. Der Provider protokolliert, welcher Kunde in welchem Zeitraum welche IP-Adresse hatte.
Wenn ein Browser nun eine Anfrage an einen Webserver stellt, schickt er seine IP-Adresse mit: Der Server muss ja wissen, wohin er seine Antwort schicken muss. Die meisten Webserver sind so konfiguriert, dass sie ihrerseits ebenfalls ein Protokoll führen. Darin steht, welcher Client wann welche Seite aufgerufen hat.
Beispiel für einen Protokoll-Eintrag:
12.34.56.78 - - [05/Dec/2016:09:31:07 +0100] "GET /index.php HTTP/1.1" 200 3860
"https://www.server.de/" "Mozilla/5.0 (Windows NT 6.1; rv:50.0) Gecko/20100101
Firefox/50.0"
Es wird also zusätzlich zur IP-Adresse und dem genauen Zeitpunkt (am Anfang der ersten Zeile) gespeichert, welcher Browser und welches Betriebssystem verwendet werden.
Mit diesen Protokolldaten kann z.B. im Fall einer Straftat beim Provider erfragt werden, welcher Kunde zu einem bestimmten Zeitpunkt eine IP-Adresse besessen hat. Damit können dann juristische Schritte eingeleitet werden. Natürlich wird damit nur der Anschlussinhaber festgestellt – wie im Abschnitt „NAT“ beschrieben wurde, sind alle Teilnehmer hinter dem Router mit der gleichen IP-Adresse im Internet unterwegs. Daher sollte das private WLAN stets verschlüsselt werden, um zu verhindern, dass Fremde den Anschluss missbrauchen.
Cookies
Auch wenn keine Straftaten begangen werden, interessieren sich Internetanbieter dafür, wer welche Seiten im Internet anschaut. Zum Beispiel lässt sich aus den Internetsuchen ableiten, für welche Produkte sich ein Nutzer interessiert, so dass ihm maßgeschneiderte Werbung angezeigt werden kann.
Die IP-Adresse ist allerdings nur schlecht geeignet, einen Nutzer dauerhaft zu identifizieren: Sie wechselt täglich, und hinter einer IP-Adresse kann eine Vielzahl von Nutzern sitzen. Effektiver sind da Cookies: Ein Cookie ist eine kleine Textdatei, die der Browser auf Befehl vom Server hin auf dem Computer ablegen und wieder auslesen kann. Für den Nutzer zeigt sich der Vorteil darin, dass z.B. der Warenkorb eines Webshops auch dann weiterhin verfügbar ist, wenn man zwischendrin den Browser geschlossen hat oder dass man bei Facebook die Zugangsdaten nicht eingeben muss. Allerdings kann eine Website wie Facebook damit auch ein detailliertes Profil eines Nutzers erstellen, da der „Gefällt mir“-Button inzwischen auf vielen anderen Webseiten vertreten ist. Jedes Mal, wenn der Button angezeigt wird, kann Facebook versuchen, seinen Cookie auszulesen und kann damit eine weitere Information dem Profil des Nutzers hinzufügen.
Da es für die Funktionalität vieler Webseiten notwendig ist, dass Cookies gesetzt werden dürfen, sollten diese zumindest beim Schließen des Browsers automatisch gelöscht werden.
E-Mail Dienst
Der E-Maildienst ist neben dem World Wide Web (WWW) einer der bekannten, weit verbreiteten Dienste des Internets. Er wird durch Mailserver realisiert, die die Postfächer der Kunden verwalten und die ankommenden E-Mails entgegennehmen. Der Nutzer startet auf seinem Rechner ein Clientprogramm (z. B. Microsoft Outlook, Thunderbird) und lädt die E-Mails vom Server herunter oder verschickt E-Mails über den Server. Da das Clientprogramm die Anfrage sendet und der Server nur auf eingehende Anfragen reagiert, ist auch dies eine Client-Server-Anwendung.
Abgeschickte E-Mails werden vom Mailserver über viele Router an den entsprechenden Mailserver des Empfängers gesendet. Dadurch kann jeder die E-Mails mitlesen, der Zugriff auf einen der Router hat, sofern sie unverschlüsselt gesendet werden. Ein E-Mail entspricht somit einer Postkarte und sollte nie vertrauliche Daten enthalten.
Möchte man eine abhörsichere Kommunikation sicherstellen, müssen die E-Mails verschlüsselt werden. Dazu gibt es Programme wie zum Beispiel Pretty Good Privacy (PGP) 3, die eine sichere Verschlüsselung anbieten.
Die Kommunikation zwischen E-Mail-Client und Server umfasst im Gegensatz zum WWW zwei verschiedene Aktionen: das Empfangen und das Versenden von Briefen. Daher gibt es für die beiden Aktionen verschiedene Protokolle:
-
SMTP (Simple Mail Transfer Protocol) zum Versenden
-
POP3 (Post Office Protocol 3) oder IMAP (Internet Message Access Protocol) zum Empfangen. Im IMAP Protokoll ist neben dem Herunterladen der Mails auch die Verwaltung der Mails auf dem Server geregelt. Daher verwendet man es, wenn die Mails immer auf dem Server bleiben sollen und nur bei Bedarf heruntergeladen werden.
Es kann je nach Provider sogar verschiedene Server zum Versenden und zum Empfangen der Mails geben. Diese Server werden wie beim WWW auch durch Angabe eines Domain-Namens oder einer IP-Adresse festgelegt: z.B. smtp.web.de und pop3.web.de.
Domain Name System (DNS)
Im Internet werden die Computer von Menschen über ihre Namen und nicht ihre IP-Adresse identifiziert. Im Browser gibt man z.B. die URL (Uniform Resource Locator – z.B. http://www.gymnasium-ettenheim.de) der gewünschten Seite ein. Diese URL enthält die Bezeichnung der Domäne, die nichts anderes als der Name des Computers ist.
Jedem Domainnamen ist eine IP-Adresse zugeordnet. Dadurch erhält man eine lange Liste von Domainnamen mit den zugehörigen IP-Adressen. Zu Beginn der Entwicklung des Internet wurde auf jedem Client-Rechner eine derartige Tabelle geführt. Als das Internet aber immer weiter wuchs, wurde diese Methode zu unhandlich, weil dieselben Daten auf jedem einzelnen Client-Rechner ständig auf dem aktuellen Stand gehalten werden mussten - eine schier unlösbare Aufgabe! Also wurden diese Daten nur noch auf bestimmten Rechnern vorgehalten, die die Rolle von "Servern für die Adress-Ermittlung" übernahmen und so zu "Name-Servern" (wie üblich in englischer Aussprache!) wurden. Jetzt musste jeder Computer, der die zu einem Domainnamen gehörige IP-Adresse benötigte, bei diesen Servern anfragen. Es ist klar, dass bei den heutigen Zugriffszahlen dieses System zu einem Zusammenbruch der Nameserver führen würde. Außerdem müsste jeder neue Domainname den Betreibern dieser Server mitgeteilt werden. Und das sind mehrere Millionen pro Jahr!
Daher hat man das System perfektioniert und ein hierarchisches System eingeführt. Ein Domainname wird daher in einzelne Teile gegliedert.
Die einzelnen Bestandteile der Domain-Bezeichnungen werden in den Domain-Namen in der Reihenfolge ansteigender Hierarchiestufen aufgeführt. Ganz am Ende des Namens steht die so genannte "top level domain". Dies ist die oberste Hierarchiestufe des DNS. Sie unterteilt das Web in thematisch ("com", "gov", "edu", "info", "berlin", "movie" usw.) oder geografisch ("de", "fr", "at", "us", usw.) abgegrenzte Bereiche. Jede dieser Top-Level-Domains wird von einer bestimmten Organisation verwaltet, bei der alle Domains unterhalb der jeweiligen Top-Level-Domain angemeldet werden müssen. So wird z.B. die Top-Level-Domain "de" vom "DEutschen Network Information Center", kurz "DENIC" verwaltet. Diese Organisation sorgt z.B. auch dafür, dass jeder mögliche Domain-Name nur einmal existiert!
Will man z.B. die Domain "wildbad-schule.de" für sich registrieren lassen, dann muss man sich an einen "Internet-Service-Provider" (ISP) wenden, der die Registrierung dieser Domain für Sie beim DENIC beantragt. Der ISP vermietet Ihnen dann üblicherweise auf einem seiner Server ein gewisses Kontingent an Festplattenplatz und gewährt Ihnen Schreibrechte in diesem Bereich, indem er Ihnen einen FTP-Zugang einrichtet. Darüber hinaus informiert er das DENIC darüber, wo genau diese Domain in Zukunft zu finden sein wird. Das DENIC wird seinerseits diese Information im Internet allgemein verfügbar machen, so dass Ihre Domain dann auch von einem beliebigen Rechner gefunden werden kann. Es ist klar, dass eine solche Dienstleistung Geld kostet - und mit diesem Geld wird letztendlich die Infrastruktur des Internets mitfinanziert!
Will nun ein Client-Rechner wissen, welche IP-Adresse zur Domain "www.pqr.xyz" gehört, fragt er bei einem Name-Server nach, und dieser liefert ihm die gesuchte IP-Adresse zurück. Wenn der ISP-Name-Server die Antwort auf die Anfrage nicht selbst kennt, dann erfragt er die Adresse bei weiteren Name-Servern. Das geht so lange weiter, bis ein Name-Server die richtige IP-Adresse zur gewünschten URL kennt. Diese Adresse liefert der Name-Server an den Client zurück.
1
Eine sehr gute Anleitung zur Erstellung von HTML-Seiten liefert
SELFHTML: http://de.selfhtml.org/
.
Zum Erstellen von HTML-Seiten ist z.B. Notepad++ geeignet:
https://notepad-plus-plus.org/
(abgerufen: Jan. 2017)
2 Die meisten DSL-Verträge enthalten eine Zwangstrennung nach 24 Stunden. Diese wird üblicherweise nachts automatisch vom Router durchgeführt.
3
Siehe Seite „Pretty Good Privacy“.
URL:
http://de.wikipedia.org/w/index.php?title=Pretty_Good_Privacy&oldid=82144865
(abgerufen: November 2016)
Hintergrundinformationen: Herunterladen [odt][355 KB]
Hintergrundinformationen: Herunterladen [pdf][533 KB]
Weiter zu Protokolle und OSI-Schichtenmodell