Beiträge

Relaunch der Digitalisierten Sammlungen

Relaunch der Digitalisierten Sammlungen mit flexiblem PDF-Download

Nach umfangreichen technischen Vorarbeiten hat unser Beta-Portal der Digitalisierten Sammlungen nun einen Reifegrad erreicht, der eine Umstellung des Produktivsystems erlaubt. Die NutzerInnen  können sich nun unter anderem auch über ein Feature-Revival freuen:

PDF-Download – aber richtig

Vor einiger Zeit sahen wir uns gezwungen, den bei Ihnen sehr beliebten PDF-Download abzuschalten, stattdessen wurden Bilder in einem .ZIP Archiv ausgeliefert. Der einzige Grund hierfür war eine Überlast unseres zentralen Servers. Der alte Prozess rechnete die hochauflösenden Bilder nach Anfrage des Downloads in eine mittlere Auflösung um, band sie dann in ein PDF zusammen und verschickte dies an die NutzerInnen. Dies führte regelmäßig zu einer Überlast des Imageservers, was in abgebrochenen Downloads resultierte. Die von anderen Einrichtungen oft gewählte Variante, alle PDFs vorzuberechnen und direkt aus dem Dokument-Management-System auszuliefern, war für uns nicht praktikabel: allein das Umrechnen der bestehenden 114.000 Werke hätte über ¼ Jahr gedauert.

Der nun vorgestellte Ansatz funktioniert gänzlich anders: die wesentlichen Rechenprozesse werden mit Hilfe von JavaScript/HTML5 (https://parall.ax/products/jspdf) auf die Rechner der anfragenden NutzerInnen ausgelagert. Auch mit älterer Hardware stellt dies in der Regel kein Problem dar, ermöglicht jedoch eine bisher auch bei anderen Portalen weltweit unbekannte Flexibilität: nicht nur der Seitenbereich kann selbst gewählt werden (auch auf Grundlage des Inhaltsverzeichnisses), sondern sogar die Auflösung der als PDF gebundenen Images kann frei bestimmt werden.

Jedes gescannte Pixel geht auch an die NutzerInnen

So führt ein Wert von 100 Pixeln Breite zu einem Thumbnail-Teppich im PDF, der von uns voreingestellte Durchschnittswert von 1.000 Pixeln ist ein guter Kompromiss von Lesbarkeit und Dateigröße, wir ermöglichen aber auch – ohne wenn und aber – den Download der vollständigen Scanauflösung. Natürlich wie immer ohne verunstaltende Wasserzeichen. Ich verfolge hier strikt die Devise: es ist nicht an uns als Bibliothek, Ihnen eine spezifische Nutzungsweise vorzuschreiben. Daher ist es unsere bewusste Strategie, eine maximale Flexibilität anzubieten.

pdf

Das Nutzerinterface des neuen PDF-Downloads

Um Ihnen die Entscheidung zwischen Qualität und Dateigröße zu vereinfachen, geben wir auf dem Download-Button direkt eine Hochrechnung an, wie groß die angefragte Datei in etwa sein wird. Hierbei ist wichtig zu wissen, dass es wirklich nur eine grobe Schätzung ist: die reale Dateigröße kann gut um bis zu 100% abweichen.

Ungenauigkeiten aushalten – für eine bessere User Experience

Diese Herangehensweise führte intern zu einigen Diskussionen: BibliothekarInnen schätzen keine Ungenauigkeiten, schon gar nicht in diesen Größenordnungen. Das übliche Vorgehen wäre, eine solche Angabe dann konsequent auszublenden. Ich hingegen bin der Auffassung, dass NutzerInnen die Information, ob der Download ca. 20 MB oder 200 MB groß sein wird, sehr wohl zu schätzen wissen. Die Größenordnung zählt – es ist demgegenüber einigermaßen egal, ob die Datei nun 15, 20 oder 25 MB groß ist.

Wege zum PDF

Sie erreichen den PDF-Download entweder aus der vollständigen Gliederung eines Werkes heraus, bei der Sie beliebige Strukturelemente wie Kapitel für den PDF-Download auswählen können. Oder aber Sie gehen über das Symbol des Werkzeug-Kastens im Bereich “Bild”.

Wege zum PDF-Download

Wege zum PDF-Download

Voraussetzung für die Funktionalität ist zum einen ein HTML5-fähiger Browser sowie aktiviertes JavaScript. Dem PDF vorangestellt wird eine Seite mit den grundlegenden bibliographischen Metadaten sowie dem persistenten Identifier. Für den Ausdruck ist es wichtig zu erwähnen, dass unsere PDFs keine Papiergröße (DIN A4 etc.)  vorgeben: im Druck-Dialog ist daher im Zweifel die Funktion „Auf Papiergröße skalieren“ zu aktivieren.

Der PDF-Download wurde maßgeblich von Tim Jabs realisiert, der erst vor wenigen Monaten seine Ausbildung als Fachinformatiker für Anwendungsentwicklung bei uns in der Abteilung Informations- und Datenmanagement (IDM) abgeschlossen hat.

Weitere neue Features der Digitalisierten Sammlungen wie Doppelseitenansicht, verbesserte Trefferliste, Expertensuche oder Responsives Design werden wir in separaten Beiträgen in Kürze hier veröffentlichen.

Drei Briefe im Juni

Drei Briefe im Juni oder Autographen können nicht fahren …

Die Arbeit in der Handschriftenabteilung ist außerordentlich abwechslungsreich. Die Bestände sind einzigartig und vielfältig. Die Besucher und Anfragen kommen aus der ganzen Welt. Wir sind keine Graphologen und die Frage eines Besuchers, was denn Autographen wären,  ob sie fahren könnten wie die deutschen Autos, musste ich verneinen. Das Wort kommt aus dem Griechischen- auto graph – heißt selbst geschrieben, lateinisch manu propria. Eigenhändig  geschrieben sind die im Haus gesammelten Briefe und Aufzeichnungen.

In der Bibliothek entstand über einen Zeitraum von mehr als 350 Jahren ein Besitz von außerordentlicher Tiefe und Verschiedenartigkeit, da durch die Eingliederung von Sonder- und Privatsammlungen vielfältiges detailliertes Wissen ins Haus kam. Das sind mittelalterliche und moderne Handschriften, handschriftliche Nachlässe von Dichtern, Wissenschaftlern und Komponisten, Noten und Karten, Sammlungen und Einzelautographe, bei denen immer der Besitzer mit seinem Wissen den Charakter der Sammlung prägte.

Im 20. Jahrhundert stiftete zum Beispiel der Chemiker Ludwig Darmstaedter (1846-1927) seine Autographen-Sammlung zur Geschichte der Naturwissenschaften und der Technik samt einem finanziellen Erwerbungsetat für die Weiterführung der Sammlung in der Staatsbibliothek. Seine Sammlung enthielt auch vollständige Nachlässe von bedeutenden Wissenschaftlern, Typoskripte, Porträts, Karten, Sonderdrucke und Faksimiles.

Unter den über 1000 Nachlässen in der Bibliothek stehen großartige Namen wie Alexander von Humboldt oder Adelbert von Chamisso heute im Mittelpunkt einzelner Projekte der Staatsbibliothek. Ihre Aufzeichnungen können weltweit digital betrachtet werden. Bei der Suche nach Autographen bietet die Verbunddatenbank Kalliope den Sucheinstieg in die Welt der handgeschriebenen Objekte, weist die Namen und Bestände nach.

Es gibt Hunderttausende Autographen in der Staatsbibliothek, ich möchte drei herausgreifen und sie kurz vorstellen. Es geht wie so oft auch bei großen Geistern um profane Fragen- ums Geld und  um die Liebe.

Am 4. Juni 1519 nahm ein Künstler in Rom die Feder zur Hand und sorgte für die Verbesserung seiner finanziellen Situation:

In Übersetzung lautet der Text: „ich Michelangelo Sohn des   Lodovichio Simoni, Florentinischer Bildhauer hier in Rom  habe heute empfangen, an diesem Tage, dem 5. Juni von Lionardo de Bartolini, ebenfalls einem Florentiner, zur Bezahlung eines Gemäldes unserer Frau, das ich zu machen übernommen habe, 100 Dukaten aus der Kammer und zur Beglaubigung, das es wahr sei, habe ich dies mit meiner eigenen Hand – manu propria – geschrieben. 1519.

Michelangelo Buonarroti (1475- 1564), der Maler, Bildhauer und einer der größten Künstler aller Zeiten schrieb also eine Quittung über 100 Dukaten für Lionardo de Bartolini. Dieses Blatt aus der Sammlung Darmstaedter wurde durch das Antiquariat Martin Breslauer in Berlin erworben und kostete 1917 stattliche 1000 Mark.

Ludwig Darmstaedter, der große Sammler und Mäzen der Staatsbibliothek wollte seiner Sammlung unbedingt ein Blatt der Großen der italienischen Renaissance hinzufügen. Aber Autographe der Künstler dieser Zeit sind höchst selten und oftmals gefälscht. Nach längeren Verhandlungen und der Vermittlung Martin Breslauers, zu dem Darmstaedter herzliche Verbindungen unterhielt, und der wie er im Verein der  Freunde der Staatsbibliothek aktiv war, konnte dieses Blatt aus dem Besitz des Kaisers Maximilian von Mexiko erworben werden. Oder war es doch das Werk eines Fälschers? Die Korrespondenz zu dieser Frage wird bis in die Gegenwart geführt.

Ein anderes pekuniäres Thema spricht der schwedischer Chemiker und Erfinder Alfred Nobel (1833-1896) am 30. Juni 1880 in einem Brief an den deutschen Bergverwalter Bernhard Turley (1831-1908) an. Alfred Nobel hielt sich in Berlin auf und schrieb seinem alten Mitarbeiter, dass ihm seine Erfindung abgesprochen werden soll.

Es taucht plötzlich in Amerika ein H. Dittmar, welcher ehemals auf Krümmel in der Dynamit Fabrik angestellt war, auf und will mir die Dynamit Erfindung abstreiten.“  

Alfred Nobel war der Erfinder des Dynamits, jenem Sprengstoff, der auf der Anwendung von Nitroglycerin beruht. Er ist der Stifter des Nobelpreises, der alljährlich in Stockholm vergeben wird und dessen Stiftungskapital aus dem weltweiten Gewinn des Dynamits stammt. Nobel ließ sich 1867 seine Marke patentieren und übersiedelte mit seiner Fabrik nach Krümmel bei Hamburg. Turley arbeitete von 1866-1868 für Nobel, zur gleichen Zeit wie Carl H. Dittmar.

doch wäre es mir von hohem Interesse zu erfahren was sie sich wohl noch aus dieser nebelumschleierten Zeit erinnern können, Sie waren glaube ich bei den Versuchen sowohl in Clausthal als Königsgrube anwesend…. . Können Sie sich noch erinnern: Oder haben Sie an diese Zeit noch andere, die curiose Geschichte erläuternde Erinnerungen?

Ein Antwortbrief ist uns nicht überliefert, aber Alfred  Nobel gewann den Streit, sonst gäbe es heute keinen Nobelpreis.

Auch im Juni, am 18. 6.1810 schrieb Adelbert von Chamisso aus Paris an seinen Freund, den Dichter Friedrich de la Motte Fouqué in Berlin: Als Gedicht reimt er

„Kann nicht reden, kann nicht schreiben, kann nicht sagen wie mir ist, …mit der Arbeit wills nicht vorwärts …,kann nicht wissen wie mir ist.

Das Blatt ist Teil des seit den 1930er Jahren  in der Staatsbibliothek verwahrten Nachlasses des Dichters und befindet sich in den digitalen Sammlungen der Bibliothek.

Für eine Stelle in Paris erhielt er eine Absage, mit der Arbeit und in der Liebe wollte nicht so recht gelingen. Doch schon fünf Jahre später schuf er in der Abgeschiedenheit des brandenburgischen Kunersdorf „Peter Schlemihls wundersame Reise“. Dieses Märchen  wurde ein Welterfolg und brachte finanzielle Sicherheit. Auch dies gehört zum Nachlass- ein umfangreiches Werk, kein langer Brief, sondern ein Manuskript.

Relaunch der Digitalisierten Sammlungen

Digitalisierte Sammlungen werden agil: neues Portal und Labor starten in Betaphase

tl;dr: Unsere Digitalisierten Sammlungen wurden umfangreich überarbeitet. In dem neuen Beta-Portal sieht für die NutzerInnen aber fast alles aus wie vorher. Dafür gibt es einen guten Grund.

Die Digitalisierten Sammlungen der Staatsbibliothek gehören zu unseren nachgefragtesten digitalen Diensten. Allein im Monat März verzeichneten wir 30.000 BesucherInnen und über 1/3 Millionen Seitenansichten. Über 100.000 Werke stehen mit mehr als 10 Millionen Seiten in hoher Auflösung (in der Regel 300 dpi oder mehr) zur Verfügung.

Warum überhaupt (noch) eine eigene Präsentationsoberfläche?

In Zeiten knapper und knappster Budges – auch für Bibliotheken – ist diese Frage absolut berechtigt. Mit dem DFG– oder Kitodo-Viewer steht seit Jahren ein einheitliches und funktional gut ausgestattetes Werkzeug zum Lesen von Digitalisaten zur Verfügung, sofern die Metadaten im METS/MODS Format vorliegen. Neue Entwicklungen wie der auf IIIF Technologien basierende Viewer Mirador bieten gute Funktionen im Bereich der synoptischen Bildanalyse. Auf der Nachweisebene folgt die Staatsbibliothek der Devise: keine Digitalisierung und Präsentation eines Werkes, das nicht zuvor im zentralen Katalog (OPAC – StaBiKat nachgewiesen wird. Auch hier kann man also die Sinnfrage einer zusätzlichen Suchoberfläche stellen.

Darum: die Qualität von Bibliotheksdaten sichtbar und nutzbar machen

Schaut man sich jedoch die Struktur der von uns bereit gestellten Daten an, so zeigt sich schnell: gerade an den Schnittstellen von Suchindex zu Trefferliste und von Treffer zu Objektanzeige gehen leicht nutzungsrelevante Informationen verloren. Der OPAC weiß nichts von unseren Strukturdaten (zumeist Inhaltsverzeichnisse, aber beispielsweise auch ausgezeichnete Illustrationen oder Karten), ebenso wenig von unseren OCR-generierten Volltexten. Eine zu einfach gestrickte Trefferliste verschleiert allzu oft, warum eigentlich ein Objekt als Treffer angezeigt wird. Die Feature-Entwicklung von Trefferlisten ist gefühlt vor 10 Jahren stehen geblieben. Bei der Objektpräsentation werden ebenfalls oft die Volltexte versteckt und unsichtbar im Hintergrund gehalten – mit der Konsequenz, das WissenschaftlerInnen keinen Eindruck von der zuweilen ja durchaus problematischen OCR-Qualität gewinnen können.
Ich glaube, dass Bibliotheken gut beraten sind, eigene Kompetenz im Bereich der Suchmaschinentechnologie vorzuhalten und weiter auszubauen. Ebenso im Bereich der graphischen Nutzungsoberflächen. Der Auftrag von Bibliotheken war seit je her nicht nur die Sammlung und Aufbewahrung von Wissen, sondern auch ihre Vermittlung. International regt sich in letzter Zeit Kritik an der Qualität von Google Books – wir können hier nur dann überzeugend mitreden, wenn wir es selbst substantiell besser machen. Niemand kennt die Struktur unserer Daten besser als wir: dieses Potential gilt es zu heben. Und ein Wettbewerb der Ideen ist genau, was wir jetzt brauchen.

Ein neuer Anfang

Die Technologie zur Verwaltung unseres eigenen Suchindex der Digitalisierten Sammlungen der Staatsbibliothek zu Berlin ist in die Jahre gekommen: einzelne Code-Fragmente datieren aus dem Jahr 2004. Es war an der Zeit für eine grundlegende Modernisierung. Was direkt auffällt: durch die neue technische Basis – über die es demnächst hier einen eigenen Beitrag geben wird – wurden teils dramatische Geschwindigkeitsgewinne erzielt. Die folgende Grafik zeigt die durchschnittliche Umblättergeschwindigkeit innerhalb eines Bandes in Bezug gesetzt zum Seitenumfang des Werkes:

 

Blätterzeit der neuen Digitalisierten Sammlung

Neben Performance-Steigerungen sind jedoch auf den ersten Blick nur wenige neue Funktionen hinzugekommen. Das hat seinen Grund. Wir haben in unserer „AG Präsentation“ eine gut gefüllte Wunschliste, welche neuen Ansätze wir gern probieren würden – etwa auch und gerade im Hinblick auf die Trefferliste, die wir gern komplett neu denken würden.

 

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

Unser Planungsboard – eine open-source-Alternative zu Trello: http://kanboard.net/

 

Anders als bisher wollen wir jedoch nicht einmal jährlich einen großen Schwung an neuen Features veröffentlichen, sondern lieber einzelne Features zur Diskussion stellen, in viel kürzeren Abständen als bisher. Die neue technische Basis erlaubt uns hier ausgesprochen schlanke Entwicklungsansätze, so dass Experimente und Korrekturen viel schneller umgesetzt werden können. Erfolgreiche Konzepte mögen ihren Weg auch in andere Nachweissysteme finden. Natürlich stehen sämtliche unserer Entwicklungen unter einer open-source-Lizenz, und auch ein Veröffentlichungsmodus dafür ist in Planung – aber das ist genügend Stoff für einen weiteren Beitrag.
Wir stellen uns den zukünftigen Ablauf in etwa so vor:

  1. Sie testen gründlich unsere neue Beta –  http://digital-beta.staatsbibliothek-berlin.de – auf Herz und Nieren, auch und gerade im Vergleich zu der alten Präsentation, die weiterhin verfügbar bleibt.
  2. Relativ bald würden wir dann die jetzige Beta – einen Erfolg vorausgesetzt – als neue Hauptinstanz umschwenken.
  3. Das Beta-Portal bleibt jedoch bestehen: hier werden wir in relativ rascher Abfolge jeweils ein neues Feature implementieren, und hier im Blog erläutern und zur öffentlichen Diskussion stellen.
  4. Bei Gefallen findet es zügig den Weg in die Produktivinstanz, das Beta-Labor steht für das nächste Experiment frei und der Prozess beginnt erneut bei 3.

Unter dieser Adresse http://blog.sbb.berlin/tag/digitalisierte-sammlungen bleiben Sie tagesaktuell auf dem Laufenden, gern auch per RSS-Feed. Ganz entscheidend ist, dass Sie sich einbringen – am liebsten unter diesem Beitrag im Kommentarbereich, möglich sind natürlich auch Kanäle wie E-Mail, Twitter oder Facebook.