[Diese Seite ist Teil der Homepage www.mein-html.de]

Ihre Datenspur im World Wide Web


Indem Sie das Internet nutzen, hinterlassen Sie bei den Anbietern der von Ihnen besuchten Server eine Datenspur. Denn im Gegensatz zu Abrufsystemen mit zentraler Betreibergesellschaft wie z.B. Bildschirmtext werden im World Wide Web keine Seiten aus einem zentralen Seitenspeicher abgerufen, sondern es findet bei jedem Seitenabruf eine Kommunikation mit einem HTTP-Server statt, z.B. mit dem Rechner, auf den die Adresse http://daten.3.rehbein.net zeigt.

Der Server liefert deshalb nicht zwingend eine statische Seite, sondern kann individuell auf die Anfrage reagieren. So kann er Ihnen z.B. mitteilen, daß der Abruf dieser Seite am 13.10.2024 um 15:12 Uhr und 46 Sekunden stattfand.

Der Server ist auch in der Lage, diverse Informationen rund um die stattfindende Kommunikation zu protokollieren und auszuwerten. Denn Sie übermitteln bei jedem HTTP-Abruf gewollt und ungewollt einige Informationen:  


 

IP-Adresse

Für jede Kommunikation im Internet, sei es nun das World Wide Web mit dem Protokoll HTTP, oder eine andere Anwendung mit einem anderen Kommunikationsprotokoll, benötigen Sie eine IP-Adresse (IP=Internet-Protocol). Wie der Name "Adresse" schon sagt, könnte ihr Rechner ohne IP-Adresse nicht adressiert werden, d.h. es könnten keine Daten, keinerlei Webseiten bei ihm ankommen.

Die von Ihnen momentan verwendete IP-Adresse ist:

  • 44.220.184.63

Diese IP-Adresse gibt Aufschluß darüber, wie Sie an das Internet angeschlossen sind. Denn jede IP-Adresse im Internet ist genau einem "Besitzer" zugeordnet. Wenn Sie an einem Komputer sitzen, der fest mit dem Internet verbunden ist (z.B. im Rechenzentrum einer Hochschule oder eines großen Unternehmens), so identifiziert die IP-Adresse genau diesen Rechner.

Wenn Sie sich per Telephon, DSL-Verbindung, Kabelmodem oder über andere Zugangswege in das Internet einwählen, dann identifiziert die IP-Adresse den Komputer ihres Providers, über den Sie sich in das Internet eingewählt haben. Denn nicht Sie, sondern ihr Zugangs-Provider ist fest mit dem Internet verbunden. Typischerweise erhalten Sie bei jeder Einwahl eine andere IP-Adresse. Denn Ihr Provider hat eine Vielzahl von Rechnern mit jeweils eigener Adresse. Besonders gilt dies natürlich für die großen Provider wie T-Online oder AOL. Sie werden bei Ihrer Einwahl nach dem Zufallsprinzip mit einem der Zugangsrechner verbunden. Ihnen ist die IP-Adresse also nicht dauerhaft zugeordnet, sondern nur für die Zeitdauer ihrer Internet-Sitzung. Nur der Zugangsprovider weiß, zu welchem Zeitpunkt welcher Kunde welche IP-Adresse hatte, der von Ihnen adressierte Server hat darüber aber keine Kenntnis. Jedoch läßt sich anhand der IP-Adresse immerhin noch erkennen, welchen Provider Sie für den Internet-Zugang nutzen.

Aufschlußreich kann auch sein, welcher langschriftlicher Name der IP-Adresse zugeordnet ist. Ihre IP-Adresse 44.220.184.63 hat als ausführlichen Namen die folgende Bezeichnung:

  • ec2-44-220-184-63.compute-1.amazonaws.com

Bei manchen Providern gibt dieser Name Aufschluß über den Ort des Einwahlknotens oder über die verwendete Zugangstechnik. Um diese Informationen richtig zu deuten, muß man allerdings Kenntnisse bzw. Erfahrungswerte über die Adreßstruktur des jeweiligen Providers haben.'

Über entsprechende Verzeichnisdienste läßt sich auch herausbekommen, auf wen die jeweilige IP-Adresse überhaupt angemeldet ist. Wenn Sie mehr Informationen zu 44.220.184.63 sehen wollen, klicken Sie hier:

Mit Diensten wie z.B. www.dyndns.org können erreichen, daß ein Domainname immer auf Ihre gerade aktuelle IP-Adresse zeigt. Damit können Sie zu Hause z.B. einen Webserver betreiben. Eine Beispielanwendung ist die folgende:

Wenn Sie Ihre IP-Adresse verbergen wollen, können Sie einen Anonymisier-Dienst nutzen wie zum Beispiel Anonymizer. Allerdings weiß dieser dann die IP-Adresse. Reine Proxy-Server übermitteln in der Regel zusätzlich zu den übrigen Informationen auch die IP-Adresse des ursprünglichen Clients, so daß dieser nicht wirklich anonym ist. Schauen Sie bei Verwendung eines Proxy-Servers auf der Webseite http://www.mein-whois.de/request.html nach, welche Daten tatsächlich übermittelt werden.


 

Port-Nummer

Auf einem Komputer können zur gleichen Zeit mehrere Anwendungen laufen, die mit dem Internet kommunizieren, z.B. können Sie mehrere Browserfenster gleichzeitig offen haben. Ihr Rechner hat aber nur eine einzige IP-Adresse, die bereits oben erwähnte Adresse 44.220.184.63. Damit er aber trotzdem gezielt mit den einzelnen Anwendungen kommunizieren kann, gibt es als Sub-Adressierung nach der IP-Adresse noch die Port-Nummer.

Man kann sich dies so verstellen wie in einer Wohnung, in der mehrere Personen leben, aber nur ein Telephonanschluß existiert: Alle Personen haben dieselbe Telephonnummer. Der Anrufer muß also zum Erreichen einer bestimmten Person nicht nur die Telephonnummer wählen, sondern zusätzlich auch noch sagen, mit wem genau er sprechen will.

Entsprechend müssen die in der Wohnung lebenden Personen auch dann, wenn sie selbst jemanden anrufen und diesen um einen Rückruf bitten, nicht nur ihre Telephonnummer angeben, sondern auch ihren Namen. Ansonsten könnte der spätere Rückruf nicht korrekt verbunden werden, wäre also nutzlos.

Jede Anwendung (d.h. jede Software) die mit dem Internet kommuniziert, belegt eine oder mehrere Port-Nummern. Typischerweise kommuniziert ein HTTP-Serverprozeß über die Portnummer 80. Wenn Sie also eine Webseite aufrufen, so baut Ihr Browser dazu eine Verbindung zu dem betreffenden Server auf und verlangt dort, den Port 80 zu sprechen.

Damit Ihr Browser von dem Webserver eine Antwort bekommen kann (nämlich die anzuzeigende Webseite), muß er seinerseits auch eine Port-Nummer haben. Diese Nummer ist nicht festgelegt, da es ja beliebig viele gleichzeitig offene Browserfenster geben kann. Der Browser läßt sich deshalb vom Betriebssystem eine noch freie Port-Nummer reservieren und übermittelt diese an den Webserver, um von ihm unter dieser Port-Nummer eine Antwort (quasi den Rückruf) zu bekommen.

Die von Ihrem Browser für den Abruf dieser Webseite verwendete Port-Nummer ist:

  • 60980

Meistens schreibt man die IP-Adresse und die Port-Nummer durch einen Doppelpunkt zusammen. Aus der IP-Adresse 44.220.184.63 und der Port-Nummer 60980 wird somit die Bezeichnung:

  • 44.220.184.63:60980

Die Port-Nummer (also die 60980) verrät nichts über Sie, da sie bei jedem Zugriff wieder anders lauten kann. Die Port-Nummer, die beim Webserver ankommt, muß außerdem nicht zwingend die Port-Nummer sein, die von Ihrem Browser wirklich verwendet wurde:

Wenn Sie selbst ein kleines Netzwerk mit zwei oder mehr Rechnern haben, verwenden Sie vermutlich zur Anbindung an das Internet einen Router. Obwohl Sie mehrere Komputer haben, die auf das Internet zugreifen, existiert tatsächlich nur eine Verbindung zum Internet und Sie haben auch nur eine IP-Adresse (momentan 44.220.184.63). Der Router muß also das Kunststück vollbringen, die Kommunikation der einzelnen Rechner so zu beinflussen, daß sie nach außen hin (d.h. gegenüber dem weltweiten Internet) wie ein einzelner Rechner in Erscheinung treten. Da jeder Komputer seine Port-Nummern selbst verwaltet, gibt es beim gleichzeitigen Zugriff mehrerer Rechner auf das Internet mit großer Wahrscheinlichkeit mehrfach verwendete Port-Nummern. Der Router verändert deshalb die Absenderangabe der versendeten Daten derart, daß er neue eindeutige Port-Nummern vergibt. Intern merkt er sich zu jeder von ihm vergebenen Port-Nummer, für welchen der Rechner Ihres kleinen internen Netzes und für welche originäre Port-Nummer er die betreffende neue Port-Nummer vergeben hat. Kommen dann aus dem Internet an diese Port-Nummer adressierte Daten bei ihm an, so setzt er wieder die ursprünglichen Adreßdaten ein und kann somit die Daten im internen Netz korrekt zustellen. Dieses Verfahren wird als NAT (Network Address Translation) bezeichnet.

Die Port-Nummer, die beim Webserver ankommt (hier 60980) ist die vom Router vergebene Port-Nummer, nicht die vom einzelnen Komputer im internen Netz. Zusätzlich können auch Zugangsprovider wie Router arbeiten, d.h. zahlreichen Kunden gleichzeitig diesselbe IP-Adresse geben und über NAT die Port-Nummern zuordnen. Meines Wissens nach ist dies bei dem Zugangsprovider "FreeNet" der Fall.


 

Die Referenz-Adresse

Mit der Referenz-Adresse kann Ihr Weg im Internet nachvollzogen werden. Denn dies ist die Adresse der von Ihnen zuletzt besuchten Seite, von wo aus Sie einem Link zu der aktuellen Seite gefolgt sind.

Bei Ihrem Abruf dieser Seite wurde folgende Referenz-Adresse übermittelt:

  • ---

Für das Funktionieren des World Wide Web ist die Referenzadresse nicht erforderlich. Ob sie übermittelt wird, hängt von der von Ihnen verwendeten Browsersoftware ab. Die gängigen Browser wie z.B. Internet Explorer und Netscape Navigator übermitteln die Referenz-Adresse.

Wenn Sie selbst Internet-Seiten haben, können Sie ja mal einen Link auf diese Seiten http://daten.rehbein.net setzen und beobachten, wie Ihre Adresse hier erscheint, wenn Sie dem Link folgen. Probieren Sie auch mal aus, was übermittelt wird, wenn Sie die Seite mit dem Link lokal auf ihrer Festplatte speichern oder wenn Sie die Adresse http://daten.rehbein.net in eine E-Mail schreiben und anklicken. Was dann übermittelt wird, ist je nach verwendetem Browser unterschiedlich.

Sie können auch mal diesem Link folgen oder eine Frame-Seite öffnen.


 

Browser-Software

Bei jeder Abfrage einer Webseite über das Protokoll HTTP übermittelt Ihr Browser eine Identifikation seiner Softwareversion. Hieraus geht im Allgemeinen der Name des Browsers, dessen Versionsnummer, die eingestellte Sprache und das verwendete Betriebssystem hervor. In Ihrem Fall übermittelt der Browser folgenden Text:

  • CCBot/2.0 (https://commoncrawl.org/faq/)

Welcher Text hier konkret angezeigt wird, hat der Programmierer des von Ihnen verwendeten Browsers entschieden. Bei dem Browser Lynx können Sie frei konfigurieren, mit welchem Text sich der Browser identifizieren soll.

Leider hat sich im Internet bei vielen Webdesignern die Unsitte eingeprägt, die Anzeige von Webseiten von dem verwendeten Browser abhängig zu machen. Dies bedeutet: Der Server fragt die Identifikation des Browsers ab und vergleicht sie mit gespeicherten Vorgaben des Webdesigners. Wenn der Vergleich keine Übereinstimmung ergibt, wird keine Webseite angezeigt, sondern eine Fehlermeldung generiert. Wer also mit seltener Software im Internet surft, z.B. auf einem Apple Macintosh mit dem Browser iCab oder unter dem System Linux mit dem Browser Konqueror, bekommt die betreffenden Seiten nicht angezeigt, obwohl der Browser sie darstellen könnte.

Stellen Sie sich vor, vor der Wiedergabe von Fernsehsendungen würde Ihr Fernsehgerät an die Sendeanstalt seinen Hersteller und Fabrikat melden. Wenn Sie eine Sendung ansehen wollen, überprüft die Sendeanstalt, ob der Name Ihres Geräts zu den Vorgaben des Produzenten paßt. Da der Produzent Ihrer Lieblingssendung aber nur Vertrauen zu den Geräten der Marken "Sony" und "Grundig" hat, weigert sich die Sendeanstalt, gegenüber Ihrem Gerät der Marke "Loewe" die gewünschte Sendung auszustrahlen. Statt dessen sehen Sie eine Texttafel, die Sie darum bittet, sich ein Gerät von "Sony" oder "Grundig" anzuschaffen, um die Sendung in optimaler Qualität zu empfangen. Sie können die Sendung also nicht sehen, obwohl ihr Gerät eigentlich in der Lage wäre, sie wiederzugeben.

Eine derartige kundenfeindliche Verfahrensweise ist im Bereich der Fernsehausstrahlung schon aus technischen Gründen nicht möglich. Im World Wide Web ist es jedoch technisch möglich und wird leider auch von Webdesignern so praktiziert.

Um trotz dieser Marotte vieler Webdesigner überhaupt noch sinnvoll auf WWW-Seiten zugreifen zu können, haben die Entwickler des Browsers Opera eine Art Tarnkappe eingebaut: Der Anwender von Opera kann konfigurieren, ob der Browser sich tatsächlich als Opera identifizieren soll, ob er sich als Internet-Explorer oder als Netscape Navigator ausgeben soll. Die Funktion und Darstellungsqualität des Browsers wird dadurch weder verschlechtert noch verbessert, lediglich identifiziert er sich gegenüber den besuchten Internet-Servern mit einem anderen Text.

Diese Lösung hat allerdings auch zur Folge, daß in Statistiken über die Nutzung verschiedener Browser die Opera-Software extrem niedrige Anteile hat. Denn sie wird meistens gar nicht als Opera erkannt.


 

Akzeptierte Dateitypen

Zusätzlich zu seinem Indentifikationstext übermittelt Ihr Browser auch eine Liste der von ihm akzeptierten Dateitypen. Von Ihrem Browser habe ich folgende Liste erhalten:

  • text/html, application/xhtml+xml, application/xml; q=0.9, */*; q=0.8

Zusätzlich kann der Browser auch Informationen liefern zu den von ihm verstandenen Zeichensätzen. In Ihrem Fall sind dies folgende:

  • (keine Informationen vorhanden)

Im Gegensatz zum Identifikationsstring des Browsers wären diese Informationen durchaus sinnvoll, wenn jeder Browser korrekte und detailierte Angaben übermitteln würde. Sinnvoll wäre es z.B., wenn erkennbar wäre, ob der Browser Dokumente im Format PDF (Portable Document Format) anzeigen kann oder ob er das Euro-Zeichen € darstellen kann. Doch so weit gehen die Angaben leider nicht.

Immerhin kann man anhand der Daten erkennen, ob es sich um einen gewöhnlichen HTML-Browser oder um ein Mobiltelephon mit WAP- oder i-mode-Unterstützung handelt.

Wenn Sie mehrere Browser oder mehrere Browserversionen installiert haben, können Sie diese Seite mit verschiedenen Browsern aufrufen und sich ansehen, was Ihnen angezeigt wird.


 

Server-Name

Neben diversen Daten über sich selbst übermittelt der Browser auch den Namen des Webservers, von dem er eine Seite erhalten möchte. In Ihrem Fall also der folgende Name:

In der Anfangszeit des World Wide Web wurde diese Information nicht übertragen. Entsprechend verfährt der alte Browser Mosaic. Doch dies funktioniert nur, wenn jeder Server nur genau einen Namen hat.

Sobald aber derselbe Server auf mehrere Namen hört und er auf diese Namen mit unterschiedlichen Inhalten reagieren soll, muß er gezielt mit dem jeweiligen Namen angesprochen werden. So ist mein Server, auf dem diese Seite liegt, der Server 87.185.32.182. Er hört z.B. auf die Namen http://dortmund.aplerbeck.net, http://zahlen.hoerde.net oder http://hamburg.rehbein.net. Je nachdem, mit welchem Namen der Server angesprochen wird, antwortet er mit einem anderen Inhalt.


 

Zeitstempel

Zum Schluß noch eine Information, die wenig über Sie aussagt, aber vielleicht für Sie interessant ist: Der genaue Zeitstempel, wann diese Seite aufgerufen wurde, lautet:

  • Sun, 13.10.2024 15.12.46

Im Idealfall sollte dies die gerade aktuelle Datum und die jetzige Uhrzeit sein. Dies ist der Fall, wenn Sie online auf die Serveradresse http://daten.3.rehbein.net zugreifen.

Wenn jedoch eine ältere Uhrzeit angezeigt wird, hat jetzt gar keine Kommunikation mit meinem Server stattgefunden, sondern zu dem in der Vergangenheit liegenden Zeitpunkt. Sie greifen also auf eine abgespeicherte Version dieser Seite zurück. Die angezeigten Daten wie IP-Adresse und Port-Nummer 44.220.184.63:60980 sind dann wahrscheinlich auch nicht mehr aktuell. Mein Server kennt sie schließlich nur von dem Abruf am 13.10.2024 um 15:12:46 Uhr.

Wenn Sie eine alte Seite sehen, kann die Ursache dafür sein, daß ein Zwischenspeichern von Internet-Seiten ("Caching") ohne Überprüfung auf aktuellere Versionen eingeschaltet wurde. Vielleicht sind Sie nicht direkt oder mittels eines Routers, sondern über einen Proxy-Server an das Internet angeschlossen. Proxy-Server haben meistens die Funktion, einmal aus dem Internet abgerufene Informationen lokal zu speichern und nicht neu aus dem Internet abzurufen. Vielleicht haben Sie aber auch bewußt diese Seite auf Ihrer Festplatte gespeichert, um sie später erneut zu lesen?


 

Wie Sie an der hier rechts eingeblendeten Graphik sehen, ist es unerheblich, ob Sie im Internet eine Textseite oder eine Graphik aufrufen. In jedem Fall werden die auf dieser Seite erläuterten Informationen übermittelt. In diesem Fall habe ich sie zur Verdeutlichung als Inhalt der Graphik im Form von Text hineinzeichnen lassen.

Aus Sicht der Graphik ist die Referenzadresse diese HTML-Seite, in der die Graphik eingebunden ist. Sie ist nicht mehr die Seite, von wo aus diese HTML-Seite aufgerufen wurde. Deshalb wird sie in der Graphik als "Webseite" betitelt. Auch die Port-Nummer, mit der die Graphik aufgerufen wurde, ist mit großer Wahrscheinlichkeit eine andere als die, mit der diese Seite aufgerufen wurde.

Und schließlich hat die Graphik auch einen anderen Zeitpunkt, wann sie aufgerufen wurde. Denn der Browser lädt erst die HTML-Seite, erkennt dann, daß eine Referenz auf eine Graphikdatei enthalten ist, und er lädt erst dann die Graphik vom Server.

Wenn Sie selbst Webseiten haben, können Sie die obige Graphik einfach in eine Ihrer Seiten einbauen und sich ansehen, was dann angezeigt wird. Dazu müssen Sie folgende HTML-Quelltext in die Webseite integrieren:

<IMG SRC="http://www.magik.de/php4-png/datensatz.php" ALT="" WIDTH="468" HEIGHT="60" BORDER="0" ALIGN="right">

 

[Foto:daniel-rehbein-intergeo.jpg]

http://www.the-daniel-net.de/

www.umlautfrei.de
Sprachlich korrektes...

[Foto:p.jpg]
[Foto:dew-exponate.jpg]

Mehr technische Informationen zum Internet:

Über Spam und die Sammler von Mail-Adressen

Vertrauenswürdigkeit von E-Mails (Erklärung zu SMTP)

Warum Javascript ausschalten? - Beispiele

 



[Abrufstatistik]  Nach oben  Homepage  Impressum & Copyright

  Adresse zum Setzen eines Links: http://daten.rehbein.net/