Beiträge zu Innovationen in unserem IT-Bereich

Digitalisierte Sammlungen werden agil: neues Portal und Labor starten in Betaphase

tl;dr: Unsere Digitalisierten Sammlungen wurden umfangreich überarbeitet. In dem neuen Beta-Portal sieht für die NutzerInnen aber fast alles aus wie vorher. Dafür gibt es einen guten Grund.

Die Digitalisierten Sammlungen der Staatsbibliothek gehören zu unseren nachgefragtesten digitalen Diensten. Allein im Monat März verzeichneten wir 30.000 BesucherInnen und über 1/3 Millionen Seitenansichten. Über 100.000 Werke stehen mit mehr als 10 Millionen Seiten in hoher Auflösung (in der Regel 300 dpi oder mehr) zur Verfügung.

Warum überhaupt (noch) eine eigene Präsentationsoberfläche?

In Zeiten knapper und knappster Budges – auch für Bibliotheken – ist diese Frage absolut berechtigt. Mit dem DFG– oder Kitodo-Viewer steht seit Jahren ein einheitliches und funktional gut ausgestattetes Werkzeug zum Lesen von Digitalisaten zur Verfügung, sofern die Metadaten im METS/MODS Format vorliegen. Neue Entwicklungen wie der auf IIIF Technologien basierende Viewer Mirador bieten gute Funktionen im Bereich der synoptischen Bildanalyse. Auf der Nachweisebene folgt die Staatsbibliothek der Devise: keine Digitalisierung und Präsentation eines Werkes, das nicht zuvor im zentralen Katalog (OPAC – StaBiKat nachgewiesen wird. Auch hier kann man also die Sinnfrage einer zusätzlichen Suchoberfläche stellen.

Darum: die Qualität von Bibliotheksdaten sichtbar und nutzbar machen

Schaut man sich jedoch die Struktur der von uns bereit gestellten Daten an, so zeigt sich schnell: gerade an den Schnittstellen von Suchindex zu Trefferliste und von Treffer zu Objektanzeige gehen leicht nutzungsrelevante Informationen verloren. Der OPAC weiß nichts von unseren Strukturdaten (zumeist Inhaltsverzeichnisse, aber beispielsweise auch ausgezeichnete Illustrationen oder Karten), ebenso wenig von unseren OCR-generierten Volltexten. Eine zu einfach gestrickte Trefferliste verschleiert allzu oft, warum eigentlich ein Objekt als Treffer angezeigt wird. Die Feature-Entwicklung von Trefferlisten ist gefühlt vor 10 Jahren stehen geblieben. Bei der Objektpräsentation werden ebenfalls oft die Volltexte versteckt und unsichtbar im Hintergrund gehalten – mit der Konsequenz, das WissenschaftlerInnen keinen Eindruck von der zuweilen ja durchaus problematischen OCR-Qualität gewinnen können.
Ich glaube, dass Bibliotheken gut beraten sind, eigene Kompetenz im Bereich der Suchmaschinentechnologie vorzuhalten und weiter auszubauen. Ebenso im Bereich der graphischen Nutzungsoberflächen. Der Auftrag von Bibliotheken war seit je her nicht nur die Sammlung und Aufbewahrung von Wissen, sondern auch ihre Vermittlung. International regt sich in letzter Zeit Kritik an der Qualität von Google Books – wir können hier nur dann überzeugend mitreden, wenn wir es selbst substantiell besser machen. Niemand kennt die Struktur unserer Daten besser als wir: dieses Potential gilt es zu heben. Und ein Wettbewerb der Ideen ist genau, was wir jetzt brauchen.

Ein neuer Anfang

Die Technologie zur Verwaltung unseres eigenen Suchindex der Digitalisierten Sammlungen der Staatsbibliothek zu Berlin ist in die Jahre gekommen: einzelne Code-Fragmente datieren aus dem Jahr 2004. Es war an der Zeit für eine grundlegende Modernisierung. Was direkt auffällt: durch die neue technische Basis – über die es demnächst hier einen eigenen Beitrag geben wird – wurden teils dramatische Geschwindigkeitsgewinne erzielt. Die folgende Grafik zeigt die durchschnittliche Umblättergeschwindigkeit innerhalb eines Bandes in Bezug gesetzt zum Seitenumfang des Werkes:

 

Blätterzeit der neuen Digitalisierten Sammlung

Neben Performance-Steigerungen sind jedoch auf den ersten Blick nur wenige neue Funktionen hinzugekommen. Das hat seinen Grund. Wir haben in unserer „AG Präsentation“ eine gut gefüllte Wunschliste, welche neuen Ansätze wir gern probieren würden – etwa auch und gerade im Hinblick auf die Trefferliste, die wir gern komplett neu denken würden.

 

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

 

Anders als bisher wollen wir jedoch nicht einmal jährlich einen großen Schwung an neuen Features veröffentlichen, sondern lieber einzelne Features zur Diskussion stellen, in viel kürzeren Abständen als bisher. Die neue technische Basis erlaubt uns hier ausgesprochen schlanke Entwicklungsansätze, so dass Experimente und Korrekturen viel schneller umgesetzt werden können. Erfolgreiche Konzepte mögen ihren Weg auch in andere Nachweissysteme finden. Natürlich stehen sämtliche unserer Entwicklungen unter einer open-source-Lizenz, und auch ein Veröffentlichungsmodus dafür ist in Planung – aber das ist genügend Stoff für einen weiteren Beitrag.
Wir stellen uns den zukünftigen Ablauf in etwa so vor:

  1. Sie testen gründlich unsere neue Beta –  http://digital-beta.staatsbibliothek-berlin.de – auf Herz und Nieren, auch und gerade im Vergleich zu der alten Präsentation, die weiterhin verfügbar bleibt.
  2. Relativ bald würden wir dann die jetzige Beta – einen Erfolg vorausgesetzt – als neue Hauptinstanz umschwenken.
  3. Das Beta-Portal bleibt jedoch bestehen: hier werden wir in relativ rascher Abfolge jeweils ein neues Feature implementieren, und hier im Blog erläutern und zur öffentlichen Diskussion stellen.
  4. Bei Gefallen findet es zügig den Weg in die Produktivinstanz, das Beta-Labor steht für das nächste Experiment frei und der Prozess beginnt erneut bei 3.

Unter dieser Adresse http://blog.sbb.berlin/tag/digitalisierte-sammlungen bleiben Sie tagesaktuell auf dem Laufenden, gern auch per RSS-Feed. Ganz entscheidend ist, dass Sie sich einbringen – am liebsten unter diesem Beitrag im Kommentarbereich, möglich sind natürlich auch Kanäle wie E-Mail, Twitter oder Facebook.

Es gibt keinen richtigen Link im falschen! Warum URL-Shortener politisch sind.

tl,dr: Die Staatsbibliothek zu Berlin wechselt von bit.ly auf einen eigenen Dienst zum Kürzen von URLs. Und versteht dies als einen politischen Akt.

Wir Bibliotheken gehen mittlerweile bewusster mit den Daten unserer NutzerInnen um. Einem kurzen aber heftigen Flirt mit dem Web 2.0 folgte die Ernüchterung – und die Erkenntnis, dass es vielleicht keine wirklich gute Idee ist, unsere OPAC-Suchen direkt in Facebook zu integrieren (ja, das hat es wirklich gegeben).

Google Analytics ist Geschichte

Schon seit 2011 ist auch das Thema Google Analytics vom Tisch: Dank der wegweisenden Handreichung des Landeszentrums für Datenschutz Schleswig-Holstein hat sich die Open-Source-Alternative „Piwik“ in unseren Einrichtungen durchgesetzt. Wir erhalten nach wie vor wertvolle Rückmeldungen über die Nutzung unserer Dienste. Die Daten verlassen jedoch nie unsere eigenen Server und wir können selbst den notwendigen Grad der Anonymisierung bestimmen.

Umso erstaunlicher ist es, dass ein anderer Datensammel-Dienst, in vielen unserer Services täglich dutzendfach eingesetzt, all die Jahre auf ausländischen Servern – neumodisch „Cloud“ genannt – überdauert hat: URL-Shortener. Diese kleinen Helfer sind ebenso simpel wie praktisch: auf Twitter gibt es bedenklich wenig Platz, jedes Zeichen ist kostbar. Und wer möchte schon gern solche Link-Ungetüme auf Facebook oder dem Info-Ausdruck im Lesesaal sehen:

http://staatsbibliothek-berlin.de/vor-ort/lesesaele-und-serviceangebote/unter-den-linden/

Der funktionstüchtige Versand einer solchen Adresse mittels einer E-Mail gleicht auch eher einem Glückspiel. URL-Shortener bieten hier eine einfache Lösung, sie machen aus der Adresse oben in Bruchteilen einer Sekunde:

http://bit.ly/2k8ecp6

Und das zuverlässig und kostenlos.

Die Daten unserer NutzerInnen haben dort nichts verloren

URL-Shortener kommen mittlerweile an vielen Stellen unserer Systeme vor – etwa in OPACs, Discovery-Systemen und fachspezifischen Nachweissystemen. Eben überall da, wo man NutzerInnen handliche, kurze URLs anbieten möchte.

Worüber aber wenig nachgedacht wird: Das Klickverhalten unserer NutzerInnen wir nun nicht nur von Facebook oder Twitter gespeichert und ausgewertet – das ist schließlich ihr Geschäftsmodell – sondern zusätzlich noch von einer weiteren, kommerziell am Markt agierenden Firma. Bei jedem einzelnen Klick auf einen gekürzten Link. Die Daten unserer NutzerInnen haben dort nichts verloren, ganz unabhängig ob die Firmen nun auf bit.ly, tinyurl.com oder einen der anderen 340 Namen hören.

Datensparsamkeit steht Bibliotheken gut zu Gesicht

Interessanterweise besteht über den Grundsatz der Datensparsamkeit eigentlich ein breiter Konsens, vom Bundesdatenschutzgesetz bis hin zum Grundsatz der Hacker-Ethik des Chaos Computer Club: „Öffentliche Daten nützen, private Daten schützen“ – im direktesten Sinne ein probater Wahlspruch für Bibliotheken.

Die Alternative

Die Staatsbibliothek zu Berlin hat nun einen ebenso naheliegenden wie einfachen Ausweg gewählt: die Installation eines eigenen URL-Shorteners für unsere Dienste. Im Open-Source-Bereich findet sich eigentlich nur ein ernst zu nehmender Kandidat, dem man auch gern etwas mehr Entwicklungsdynamik wünschen würde: http://yourls.org

URL-Shortener basieren auf gut verstandener Technologie, und es spricht nichts dagegen, dass bereits kleine IT-Abteilungen einen entsprechenden Dienst aufsetzen. Die Nutzeroberfläche zum Kürzen von Links ist dabei nur für die eigenen MitarbeiterInnen interessant; NutzerInnen bekommen schlicht die fertigen Links präsentiert.

Schulungsvideo oder bessere Nutzeroberfläche?

Bei der Einführung standen wir vor einer grundlegenden Entscheidung: lassen wir den Dienst unverändert, und bieten Schulungen im Haus an, wie die dann doch etwas technisch anmutende, nicht selbsterklärende Nutzeroberfläche zu nutzen ist –

Oder investieren wir die Zeit, um dank der mitgelieferten API eine leichter zu bedienende, auf die allernötigsten Funktionen reduzierte Oberfläche anzubieten?

Die Backends von 99% unserer Dienste sind eine Zumutung

Ich glaube, dass wir gut daran tun, uns an Bibliotheken auch um gut gestaltete eigene, interne Nutzeroberflächen zu kümmern. Die Backends von 99% unserer Dienste sind eine Zumutung. Wenn wir täglich mit diesem Elend konfrontiert sind, und es irgendwann einfach hinnehmen – denn: es war ja schon immer so – verlieren wir zum einen den Spaß an unserer Arbeit, verlieren aber auch Klick um Klick den Kontakt zu unseren gerade jüngeren NutzerInnen, die hocheffiziente und ästhetisch angenehme Oberflächen schlicht voraussetzen. Schon bald sprechen wir nicht mehr deren visuelle Sprache.

 

simplicity

 

Wir entschieden uns also, ein sehr reduziertes, minimalistisches Frontend für die interne Nutzung zu bauen. Dank Frameworks wie Bootstrap beschränkte sich die Investition auf ca. zwei Tage:

 

shortener-Plakat

 

 

 

Seit der Einführung vor vier Monaten wurde der Dienst von 40 unterschiedlichen Personen in unserem Haus eingesetzt, tausende Nutzerklicks landeten nicht mehr auf den Servern anderer Leute. Wenn Sie nun Links in dieser Form bei uns finden: http://sbb.berlin/9jucki – die sind von uns handgebaut, Ihre Daten verlassen nie unseren Server.

Wir planen derzeit eine Outreach-Strategie, um sinnvolle Bausteine für eine moderne, digitale Bibliothek Open Source zu stellen. Unser Yourls-Frontend wird hier nur ein sehr bescheidener Anfang sein. Dieses Blog wollen wir nutzen, um auch weit komplexere Entwicklungen zu diskutieren.

Bibliotheken haben Jahrtausende lang die Informationsverarbeitung der Gesellschaften entscheidend mitgeprägt. Firmen sollten uns diese Aufgabe nicht abnehmen.

„IT-Innovation“ oder: Was kann man mit einem Berliner Flughafen-Modell in einer Bibliothek anfangen?

Informationstechnologie (IT) ist als Grundlage für den überwiegenden Teil der Projekte, die im Bibliotheksbereich durchgeführt werden, nicht wegzudenken. Der Anteil der IT differiert dabei, ebenso wie das Themenspektrum: Von der Präsentation der Digitalisierten Sammlungen über neue Nachweisinstrumente bis hin zu Services, die man zunächst vielleicht gar nicht im Angebot einer Bibliothek erwartet.

So ist es auch im Bereich der IT-Innovationen in der Staatsbibliothek: Wir befassen uns intensiv mit der Konzeption, Entwicklung und Evaluation von digitalen Informationsdienstleistungen. Dies geschieht in enger Zusammenarbeit mit den Fachabteilungen und anderen Partnern nach Maximen der Usability und Nutzerorientierung.
Mit diesem Blog “IT-Innovation” möchten wir nun eine Plattform etablieren, die wir zum einen für Informationen über unsere Aktivitäten in diesem Bereich nutzen wollen, die gleichzeitig aber auch die Möglichkeit bietet, mit Ihnen zu diesen Themen in einen Dialog zu treten.
So werden wir Ihnen in den nächsten Beiträgen mit dem URL-Shortener ein Beispiel für einen neu entwickelten Service und mit der Beta-Version der umgebauten Präsentation der Digitalisierten Sammlungen ein weiteres prototypisches Ergebnis aus der der “IT-Werkstatt” vorstellen.
Es sollen an dieser Stelle aber nicht nur Ergebnisse präsentiert werden. Wir wollen auch Einblicke in unsere internen Abläufe anbieten. Es wird daher auch Beiträge zu verwendeten Technologien geben, ebenso wie zu Methoden, die zum Beispiel bei unserer Software-Entwicklung eingesetzt werden. Als Stichworte seien hierfür Scrum und agiles Projektmanagement genannt – modifiziert für die Anwendung in Bibliotheken.

Und natürlich wird auch die Frage nach dem Nutzen des „Flughafen-Modells“ in der Bibliothek an dieser Stelle beantwortet werden – in Berlin naturgemäß ein ganz heißes Eisen.
Wir hoffen, Ihnen mit diesem Beitrag einen kleinen Vorgeschmack gegeben zu haben auf das, was da kommen mag und sind sehr gespannt, welche Debatten sich auf dieser Plattform entwickeln werden.