© Fotolia/ProfphotoXL, Bild einer Festplatte

Wie GeoCities archiviert wird

WEB
02.05.2009

Demnächst wird Yahoo seinen Hosting-Dienst GeoCities schließen. Damit werden Terabytes echter "Homepages" aus der Frühzeit des ersten Web-Booms für immer aus dem Netz verschwinden. Ein Team von Web-Archivaren ist nun dabei, diesen Schatz der Popkultur für die Nachwelt zu bewahren.

"Die Feiglinge von Yahoo haben ganz heimlich, still und leise angekündigt, dass sie GeoCities dichtmachen werden", schreibt Jason Scott am 24. April in seinem Weblog. "Sie wollen diesen beinahe 20 Jahre alten Hosting-Dienst abschalten, der über die Jahre zur Heimat von Millionen Nutzern geworden ist." Für den begeisterten Sammler virtueller Artefakte aus dem frühen Web der 1990er Jahre war sofort klar: "Das ist ein Teil unserer Geschichte. Unserer Kultur. Es ist etwas, das ich für künftige Generationen bewahren möchte."

GeoCities wurde 1994 als Beverly Hills Internet gegründet. Die Firma wuchs im Boom des jungen Webs sehr schnell, für viele Menschen war das ab 1995 verfügbare Angebot, sich auf dem Server der Firma kostenlos eine Website einzurichten, eine erste Gelegenheit, sich am Aufbau einer eigenen Homepage zu versuchen. Es gibt dort die üblichen Sammlungen an "Under Construction"-Schildern und animierten GIFs, aber auch komplexe Websites von Hobbyisten, die in den jeweiligen Subkulturen als Referenz gegolten haben.

Ausdrucksmittel GeoCities

"Du bist zu GeoCities gegangen, um deine Ideen dem Publikum zu präsentieren", schreibt Scott. "Deine Aufzeichnungen über dein liebstes Hobby oder deine bevorzugte Verschwörungstheorie verließen zum ersten Mal die Festplatte deiner Windows-3.1-Kiste und wurden zu etwas, das du jedem Internet-Nutzer präsentieren konntest. In Farbe. Und zwar sofort." 1999 übernahm Yahoo GeoCities für rund 3,5 Milliarden US-Dollar. Der Plan, all die Enthusiasten-Websites über die Einblendung von Werbebannern und Textanzeigen zu monetarisieren, schlug fehl.

Scott rief Gleichgesinnte dazu auf, sich mit ihm im IRC-Channel #archiveteam zu treffen und Bandbreite sowie Speicherplatz für das Projekt zu organisieren. Schon am 26. April hatten er und das Team über 200.000 GeoCities-Websites gesichert, darunter die meisten Sites aus den Jahren vor 1999. "Wir wissen noch nicht, welches Datenvolumen GeoCities insgesamt hat", schreibt Scott auf Anfrage von ORF.at. "Einige schätzen, dass es bis zu 50 Terabyte sein können. Ich persönlich glaube, dass es nicht so umfangreich ist, ich vermute, dass wir es mit fünf bis 15 Terabyte zu tun haben."

Rackern auf der Kommandozeile

"Derzeit arbeiten rund 20 Leute im engeren Team mit", schreibt Scott an ORF.at. "Wir kommunizieren über unseren IRC-Channel." Die technischen Details des Archivierungsprozedere will er aber nicht preisgeben. "Sonst könnte noch jemand bei Yahoo auf die Idee kommen, gegen uns vorzugehen. Aber es läuft alles über ganz normale http-Verbindungen." Eines der im Einsatz befindlichen Tools ist das freie Datenübertragungsprogramm rsync.

Die wichtigste Frage, die sich heutzutage angesichts einer solchen Aktion aufdrängt, ist aber wohl die nach eventuellen Copyright-Problemen. "Die hätten wir nur dann, wenn wir die Websites spiegeln würden", so Scott. "Wir saugen aber nur die Daten ab und fertigen drei bis fünf redundante Kopien davon an. Wenn wir das Projekt abgeschlossen haben, werden wir fragen, ob Archive.org oder die Library of Congress eine Kopie davon haben wollen. Es kann sein, dass ein Teil der Sites wieder öffentlich übers Internet zugänglich gemacht wird."

Komplexe Strukturen

Angesichts der tief verschachtelten Struktur von GeoCities, toten Links und, wie es Scott ausdrückt, "verrückten Javascripts zur Anzeige von Werbung" ist es gar nicht so einfach, alle Inhalte zu finden und zu archivieren. "Ich weiß jetzt viel mehr über GeoCities, als ich jemals in Erfahrung bringen wollte", schreibt Scott, der sich durch die verschiedenen Schichten von Strukturen arbeiten muss, die GeoCities im Lauf der Zeit angelegt hat. So legte der Dienst zu Beginn noch traditionelle User-Homeverzeichnisse auf seinen Unix-basierten Systemen an. Später konstruierte man dann "Nachbarschaften", in denen beispielsweise Science-Fiction-Fans oder angehende Börsenmakler virtuell zusammenfinden konnten. Nach der Übernahme unternahm Yahoo eigene Versuche, den Hoster in seine Produktfamilie einzupassen.

Die Enthusiasten-Websites der 1990er schlossen sich auch gerne über die Grenzen der damaligen Hosting-Dienste hinaus zu Webrings zusammen. Die verbindenden Funktionen der privaten Websites und der Webrings werden heute hauptsächlich von Weblogs und Sozialen Netzwerken wahrgenommen. Diese werden die Archivare der Popkultur der 2000er Jahre sicher wieder vor ganz neue Aufgaben stellen.

(futurezone/Günter Hack)