Relaunch der Digitalisierten Sammlungen

Digitalisierte Sammlungen werden agil: neues Portal und Labor starten in Betaphase

tl;dr: Unsere Digitalisierten Sammlungen wurden umfangreich überarbeitet. In dem neuen Beta-Portal sieht für die NutzerInnen aber fast alles aus wie vorher. Dafür gibt es einen guten Grund.

Die Digitalisierten Sammlungen der Staatsbibliothek gehören zu unseren nachgefragtesten digitalen Diensten. Allein im Monat März verzeichneten wir 30.000 BesucherInnen und über 1/3 Millionen Seitenansichten. Über 100.000 Werke stehen mit mehr als 10 Millionen Seiten in hoher Auflösung (in der Regel 300 dpi oder mehr) zur Verfügung.

Warum überhaupt (noch) eine eigene Präsentationsoberfläche?

In Zeiten knapper und knappster Budges – auch für Bibliotheken – ist diese Frage absolut berechtigt. Mit dem DFG– oder Kitodo-Viewer steht seit Jahren ein einheitliches und funktional gut ausgestattetes Werkzeug zum Lesen von Digitalisaten zur Verfügung, sofern die Metadaten im METS/MODS Format vorliegen. Neue Entwicklungen wie der auf IIIF Technologien basierende Viewer Mirador bieten gute Funktionen im Bereich der synoptischen Bildanalyse. Auf der Nachweisebene folgt die Staatsbibliothek der Devise: keine Digitalisierung und Präsentation eines Werkes, das nicht zuvor im zentralen Katalog (OPAC – StaBiKat nachgewiesen wird. Auch hier kann man also die Sinnfrage einer zusätzlichen Suchoberfläche stellen.

Darum: die Qualität von Bibliotheksdaten sichtbar und nutzbar machen

Schaut man sich jedoch die Struktur der von uns bereit gestellten Daten an, so zeigt sich schnell: gerade an den Schnittstellen von Suchindex zu Trefferliste und von Treffer zu Objektanzeige gehen leicht nutzungsrelevante Informationen verloren. Der OPAC weiß nichts von unseren Strukturdaten (zumeist Inhaltsverzeichnisse, aber beispielsweise auch ausgezeichnete Illustrationen oder Karten), ebenso wenig von unseren OCR-generierten Volltexten. Eine zu einfach gestrickte Trefferliste verschleiert allzu oft, warum eigentlich ein Objekt als Treffer angezeigt wird. Die Feature-Entwicklung von Trefferlisten ist gefühlt vor 10 Jahren stehen geblieben. Bei der Objektpräsentation werden ebenfalls oft die Volltexte versteckt und unsichtbar im Hintergrund gehalten – mit der Konsequenz, das WissenschaftlerInnen keinen Eindruck von der zuweilen ja durchaus problematischen OCR-Qualität gewinnen können.
Ich glaube, dass Bibliotheken gut beraten sind, eigene Kompetenz im Bereich der Suchmaschinentechnologie vorzuhalten und weiter auszubauen. Ebenso im Bereich der graphischen Nutzungsoberflächen. Der Auftrag von Bibliotheken war seit je her nicht nur die Sammlung und Aufbewahrung von Wissen, sondern auch ihre Vermittlung. International regt sich in letzter Zeit Kritik an der Qualität von Google Books – wir können hier nur dann überzeugend mitreden, wenn wir es selbst substantiell besser machen. Niemand kennt die Struktur unserer Daten besser als wir: dieses Potential gilt es zu heben. Und ein Wettbewerb der Ideen ist genau, was wir jetzt brauchen.

Ein neuer Anfang

Die Technologie zur Verwaltung unseres eigenen Suchindex der Digitalisierten Sammlungen der Staatsbibliothek zu Berlin ist in die Jahre gekommen: einzelne Code-Fragmente datieren aus dem Jahr 2004. Es war an der Zeit für eine grundlegende Modernisierung. Was direkt auffällt: durch die neue technische Basis – über die es demnächst hier einen eigenen Beitrag geben wird – wurden teils dramatische Geschwindigkeitsgewinne erzielt. Die folgende Grafik zeigt die durchschnittliche Umblättergeschwindigkeit innerhalb eines Bandes in Bezug gesetzt zum Seitenumfang des Werkes:

 

Blätterzeit der neuen Digitalisierten Sammlung

Neben Performance-Steigerungen sind jedoch auf den ersten Blick nur wenige neue Funktionen hinzugekommen. Das hat seinen Grund. Wir haben in unserer „AG Präsentation“ eine gut gefüllte Wunschliste, welche neuen Ansätze wir gern probieren würden – etwa auch und gerade im Hinblick auf die Trefferliste, die wir gern komplett neu denken würden.

 

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

 

Anders als bisher wollen wir jedoch nicht einmal jährlich einen großen Schwung an neuen Features veröffentlichen, sondern lieber einzelne Features zur Diskussion stellen, in viel kürzeren Abständen als bisher. Die neue technische Basis erlaubt uns hier ausgesprochen schlanke Entwicklungsansätze, so dass Experimente und Korrekturen viel schneller umgesetzt werden können. Erfolgreiche Konzepte mögen ihren Weg auch in andere Nachweissysteme finden. Natürlich stehen sämtliche unserer Entwicklungen unter einer open-source-Lizenz, und auch ein Veröffentlichungsmodus dafür ist in Planung – aber das ist genügend Stoff für einen weiteren Beitrag.
Wir stellen uns den zukünftigen Ablauf in etwa so vor:

  1. Sie testen gründlich unsere neue Beta –  http://digital-beta.staatsbibliothek-berlin.de – auf Herz und Nieren, auch und gerade im Vergleich zu der alten Präsentation, die weiterhin verfügbar bleibt.
  2. Relativ bald würden wir dann die jetzige Beta – einen Erfolg vorausgesetzt – als neue Hauptinstanz umschwenken.
  3. Das Beta-Portal bleibt jedoch bestehen: hier werden wir in relativ rascher Abfolge jeweils ein neues Feature implementieren, und hier im Blog erläutern und zur öffentlichen Diskussion stellen.
  4. Bei Gefallen findet es zügig den Weg in die Produktivinstanz, das Beta-Labor steht für das nächste Experiment frei und der Prozess beginnt erneut bei 3.

Unter dieser Adresse http://blog.sbb.berlin/tag/digitalisierte-sammlungen bleiben Sie tagesaktuell auf dem Laufenden, gern auch per RSS-Feed. Ganz entscheidend ist, dass Sie sich einbringen – am liebsten unter diesem Beitrag im Kommentarbereich, möglich sind natürlich auch Kanäle wie E-Mail, Twitter oder Facebook.

Endlich: das Haus Unter den Linden ohne Baugerüste

Wir freuen uns über diesen grandiosen Anblick: die Fassadensanierung am Haus Unter den Linden ist abgeschlossen und die Gerüste sind weitgehend demontiert.

Präsentation “Für heute langt’s” – die vielfältige Welt der Lesezeichen

Lesezeichen OrdnerVom 30. Oktober bis zum 28. November 2015 ist im Foyer der Staatsbibliothek (Potsdamer Straße) eine Präsentation von kuriosen, künstlerischen, historischen, exotischen, werbenden und sprechenden Lesezeichen zu sehen.

In der Handschriftenabteilung der Staatsbibliothek umfasst der Bereich Einblattmaterialien zum Beispiel Flugblätter, Theaterzettel und Exlibris – und eben auch Lesezeichen.  Weiterlesen