D: Freiheit für Bibliotheksdaten
Große Bibliotheken in Deutschland haben ihre Katalogdaten freigegeben. Damit werden nicht nur Datendienste für Bibliotheken günstiger, auch neue Dienstleistungen rund ums Buch können nun im Netz entstehen. Auch die Wikimedia Foundation will mit den offenen Katalogsdaten ihr Angebot stärken.
In der deutschsprachigen Bibliothekswelt sorgte am Wochenende eine Meldung für Furore: Die Universitäts- und Stadtbibliothek Köln (USB) gab gemeinsam mit dem Hochschul-Bibliothekszentrum Nordrhein-Westfalen (hbz) die bibliografischen Daten des USB-Katalogs frei.
Der USB-Katalog umfasst etwa 3,1 Millionen Titelaufnahmen, 1,5 Millionen Personenaufnahmen, 156.000 Körperschaftsaufnahmen, 40.000 Notationen sowie 243.000 Schlagworte Die Stadtbibliothek Köln will später folgen.
Die Bibliotheken haben jetzt Millionen ihrer Metadaten frei veröffentlicht und unter die Creative-Commons-Lizenz Zero gestellt. Damit sind sie gemeinfrei und können ohne Einschränkung genutzt werden. Rolf Thiele, der stellvertretende Direktor der USB Köln, sieht darin nur einen "ersten Schritt, um die weltweite Sichtbarkeit von Bibliotheksbeständen im Internet zu erreichen".
Nächster Schritt: Vernetzung
Es ist zu erwarten, dass nun weitere Bibliotheken und Bibliotheksverbünde ihre Daten freigeben werden. In einem weiteren Schritt können die Daten miteinander zu "Linked Open Data" verknüpft werden. Damit könnte die Vision des Web-Erfinders Tim Berners Lee verwirklicht werden, der sich seit Jahren für die Freigabe von Rohdaten einsetzt, um über vielfältige Rekombinationen neue Anwendungen im Web entstehen zu lassen.
Wikimedia hat die Daten über das Wochenende bereits für seine prototypische Personensuchmaschine aufbereitet. Die Treffer zu einzelnen Personen enthalten jetzt eine umfangreiche Literaturliste. Sie kann Bücher enthalten, die die Person geschrieben hat, und Bücher, die die Person selbst behandeln. Mathias Schindler von Wikimedia meint, dass die Zusammenführung mehrerer Katalogdatenbestände neue Dienste ermöglichen könnte, die den Standort von verfügbaren Büchern in Bibliotheken, Antiquariaten und Buchhandlungen anzeigen könnten. Damit könnte die analoge Buchwelt wieder aufleben und dem derzeit im Internet so übermächtigen Online-Buchhändler Amazon wieder Paroli bieten.
Zusammenarbeit mit Wikimedia
Bereits seit einiger Zeit hatten verschiedene Protagonisten die Freigabe der Daten gefordert. Erst Anfang März hatte die Open Knowledge Foundation eine Arbeitsgruppe namens Freie Bibliografische Daten gegründet. Wikimedia Deutschland setzt sich ebenfalls seit einiger Zeit bei Bibliothekseinrichtungen für die Freigabe der Katalogdaten ein.
Für die Bibliotheken ist das ein großer Schritt, da vornehmlich die Deutsche Nationalbibliothek diese Daten bisher in der Regel gegen Gebühren zur Verfügung stellte. Zwar wird die deutschsprachige Variante von Wikipedia seit geraumer Zeit mit Daten der Deutschen Nationalbibliothek angereichert. Doch das wurde "häufig durch den halboffenen Charakter der Daten erschwert und eingeschränkt", stellte die stellvertretende Direktorin des hbz, Silke Schomburg, fest. Künftig können Bibliotheken die Daten zu deutlich niedrigeren Kosten beziehen und die so eingesparten Mittel anderweitig investieren.
Daten als Geldquelle
Mit Blick auf die Nationalbibliothek sagte Schomburg, dass "gerade in Zeiten, in denen Verlage und auch manche bibliothekarische Organisationen die Daten in erster Linie als Geldquelle sehen", der traditionelle Auftrag von Bibliotheken wieder gestärkt werden sollte. Sie verfolgten nämlich "seit jeher das Ziel, große Mengen von Wissen möglichst vielen Menschen unter möglichst wenig Beschränkungen bereitzustellen". Außerdem seien Bibliotheken aus öffentlichen Geldern finanziert. Schomburg: "Was die Öffentlichkeit bezahlt hat, sollte ihr auch uneingeschränkt zur Verfügung stehen."
Allerdings müssen die Datenbestände für neue Anwendungen kollaborativ aufbereitet werden. Der neuseeländische Open-Data-Experte Nat Torkington forderte erst kürzlich, dass die Open-Data-Bewegung daher von der Open-Source-Welt lernen müsse. Gut organisierte Communitys könnten Fehler und Lücken besser finden und ausbessern. "Maintainer" müssten die Verantwortung für die Daten übernehmen, Tools müssten entwickelt werden, um Unterschiede in den Daten feststellen und Änderungen einbringen zu können.
Erste Ansätze gibt es bereits: Für Wikipedia haben Jakob Voss, Schindler und Christian Thiele ein Datenformat namens BEACON entwickelt. Es übermittelt die Trefferanzahl in Katalogen und Datenbanken zu einer bestimmten Person oder einem bestimmten Objekt. So kann Wikipedia bei Treffern direkt in Kataloge verlinken. Auch dieses Feature ist bereits in der Personensuchmaschine integriert. Sie zeigt im Übrigen auch an, wie Personen miteinander verknüpft sind, und bildet damit bereits eine Art Soziales Netzwerk ab.
(Christiane Schulzki-Haddouti)