The Wayback Machine Internet ArchiveHaben Sie gewusst, dass im Internet eine Zeitreise längst möglich ist? Seit November 2001 ist im Internet eine Plattform im Betrieb, die Internetseiten bereits seit 1996 archiviert - die Wayback Machine. Diese “Zeitmaschine” hat bis heute fast 40 Milliarden Seiten aufgenommen. Pro Monat kommen etwa 20 Terabytes an verschiedenen digitalen Daten hinzu. Der Crawler vom Internet Archive durchläuft die Websites gewöhnlich innerhalb von 24 bis 48 Stunden. Die indexierten Seiten werden erst nach ca. 6 - 12 Monaten öffentlich zugänglich gemacht. Allerdings fehlen solche Internetseiten im Index, die für die automatische Archivierungssoftware noch nicht bekannt waren, oder nicht zugänglich sind (zum Beispiel geschützt mit einem Passwort). Ansonsten werden auch zugängliche Unterseiten archiviert, aber zumindest eine Startseite. Damit Sie Ihre Reise in die Vergangenheit der Webseiten beginnen können, geben Sie lediglich ein URL in das Suchfeld. The Wayback Maschine zeigt als Ergebnis eine zeitlich geordnete Tabelle aller gespeicherten Seiten an, aus denen mit Hilfe von Monat und Jahr ausgewählt werden kann. So können Sie Internetseiten besuchen, die aktuell nicht mehr öffentlich zur Verfügung stehen. Projekt Internet ArchiveThe Wayback Machine ist ein Teil des Internet Archivs (Englisch: Internet Archive). Internet Archive ist ein gemeinnützliches Projekt, das im Jahr 1996 von Brewster Kahle in San Francisco gegründet wurde. Dabei werden kurzlebige digitale Daten in frei zugänglicher Form gespeichert, um Einblick in die Ursprünge und Entwicklung des Internets zu gewährleisten. Außer Momentaufnahmen von Webseiten werden auch Software, Videoaufnahmen, Tonaufnahmen, Filme, Bücher, Usenetbeiträge, Foren und ähnliches gespeichert. Jeder kann sein Beitrag leisten und Bilder oder digitale Dokumente zum Archivieren anbieten, um ein Spiegelbild unserer Gesellschaft als Ganzes festhalten zu können. Ursprünglich wurde die Wayback Machine als Recherche-Werkzeug für Wissenschaftler, Studenten und Journalisten entwickelt. Eine Sicherungskopie der Daten des Internet Archive San Francisco befindet sich in der Neuen Bibliothek von Alexandria, Ägypten.Websites in die Wayback Machine aufnehmenDie Wayback Machine durchsucht das Web und nimmt automatisch die Webseiten in ihren Index auf. Wenn Sie Ihre Webseite im Archiv nicht gefunden haben, gibt es folgende Möglichkeiten diese zum Archiv hinzufügen:
Alexa ist eine Suchmaschine, die das Internet seit 1996 durchsucht und archiviert. Websites aus der Wayback Machine entfernen, bzw. die Aufnahme verbieten.Internet Archive hat kein Interesse auf Aufnahme von Websites und Internet Dokumenten von Personen oder Organisationen, die es nicht wünschen. Um die Aufnahme in den Index zu verhindern, beziehungsweise die dort aufgenommenen Websites zu entfernen, genügt es, eine robots.txt - Datei im Hauptverzeichnis auf Ihrem Webserver abzulegen. Die robots.txt Datei hat folgende Auswirkung:
Die robots.txt Datei benutzt hierfür folgende Syntax: User-agent: ia_archiver Bevor eine Archivierungs -Anfrage ausgeführt wird, erfolgt grundsätzlich eine Prüfung der aktuellen robots.txt. auf dem Webserver. Durch diesen Mechanismus werden die Änderungen sofort wirksam. Links zum Thema “The Wayback Machine“:
|
|||
| home | impressum | agb`s | kontakt | © 2004 - 2007 codecasters gmbh | |||