Formate, Bilder, Sicherheit – Die neue Beta der Digitalisierten Sammlungen

Meistens läuft ein Update unserer Digitalisierten Sammlungen eher still ab. Neue Features werden eingespielt, Bugs werden gefixt und intern wird getestet. Tagesgeschäft halt. Inzwischen ist aber soviel passiert, dass wir etwas umfangreicher davon erzählen wollen. Und wir möchten alle NutzerInnen dazu einladen zu testen, Fehler zu finden und Anmerkungen zu geben. Denn die Beta soll bald produktiv gehen und die neuen Features für alle zur Verfügung stehen, damit im Anschluss die neue Beta entstehen kann.

Alles sicher

Die Digitalisierten Sammlungen wurden komplett auf https – also eine sichere, verschlüsselte Verbindung – umgestellt. Das haben wir erst mit dem Beta-Portal getestet, fanden es aber so wichtig, dass wir es auf dem produktiven Portal ebenso implementiert haben. Die Umstellung betrifft nicht nur den Server der die Präsentation an sich ausliefert, sondern auch den Content-Server, der für die Auslieferung unserer Bilder zuständig ist, sowie weitere Hintergrunddienste.

Alle nun folgenden Änderungen kann man hingegen nur unter dieser Adresse ausprobieren:

 

 

Bildauslieferung nach iiiF-Standard

Es beginnt mit dem Content-Server – dieser wurde neu entwickelt. Der bisherige Content-Server war mit dem Framework Node.js® umgesetzt. Bei der Neuimplementierung haben wir uns ebenfalls für diese Technologie entschieden und auf das Web Framework koa aufgesetzt.
Der Hauptgrund für die Umstellung war die Anpassung der Auslieferung der Bilder mittels des relativ neuen iiiF-Standards. Das International Image Interoperability Framework™ ist ein internationaler Standard für den Zugriff auf Bilder und das Handling der Metadaten für diese Bilder. Das erlaubt uns unsere Bilder und Metadaten noch besser mit anderen Institutionen teilen zu können, sofern diese ebenfalls auf diesen Standard setzen, was immer mehr Institutionen weltweit machen. Weiterhin erlaubt der Einsatz von Standards eine Nutzung von weiteren Projekten, die diesen Standard implementieren, wozu bspw. der iiiF-Viewer Mirador gehört.
Unser Content-Server kann etwas mehr, er implementiert neben der iiiF Image API eine Reihe weiterer Funktionen, die speziell zu unserem Stack der Digitalisierten Sammlungen gehören.
Das Beispiel zeigt ein auf 500 Pixel Breite verkleinertes Bild, das um 90 Grad gedreht in Graustufen ausgeliefert wird. Einen kurzen technischen Einblick erhält man in der NGCS routes Dokumentation, eine tiefer gehende Betrachtung der technischen Umsetzung innerhalb der Software, ist einen eigenen Beitrag wert.

Mehr Werkzeuge

Klicken Sie auf das Bild, um die Bildfilter jetzt zu testen.

Unser Werkzeugkasten hat sich erweitert. Neben einem zusätzlichen Zoom-Slider bieten wir nun einen eigenen Bereich für Bildmanipulationen. Damit lässt sich das Bild auf vielfältige Weise neu erforschen: bestimmte Bereiche können durch eine Erhöhung des Kontrastes verdeutlicht, Farben zur Veränderung des Gesamteindruckes angehoben oder abgeschwächt werden. All diese Veränderungen können für das einzelne Werk gespeichert werden und gelten dann für jedes weitere Bild, das über die Navigation innerhalb dieses Werkes aufgerufen wird.

Neuer Download-Bereich

Viele NutzerInnen wollen nicht nur online durch unsere Werke stöbern, sondern sich die Digitalisate in voller Qualität auch auf den eigenen Rechner laden. Der hierfür vorgesehene Downloadbereich ist mittlerweile so umfangreich geworden, dass er einen eigenen View verdient hat. Das neue Icon ist nach der häufigsten Anfrage an unseren Support benannt: “Wo befindet sich der PDF-Download?”, und nun hoffentlich gut genug in Szene gesetzt.

Der PDF-Download selbst hat derzeit noch kein Face-Lifting erhalten und ist weiterhin eine Client-seitige Lösung, was bedeutet: welche Anzahl und wie groß die Bilder innerhalb des PDFs sein können, hängt in großem Maße von dem Rechner ab, an dem man den PDF-Download startet. Weiterhin gibt es wie gewohnt die unkomplizierte Möglichkeit sich alle Bilder oder einzelne Abschnitte in hoher Qualität als ZIP-Datei herunterzuladen und damit selbst die Formate auf seinem Rechner zu erstellen, die für die eigene Arbeit gewünscht werden.

Neben der METS-Datei, die alle Metadaten enthält, ist es nun auch möglich diese als iiiF Manifest abzurufen. Dieses im JSON-LD Format gehaltene Dokument entspricht der iiiF Presentation API und bringt unsere Metadaten in neuer Form in die Welt. In iiiF kompatiblen Viewern, wie Mirador, können URI’s zu dem Manifest geladen und damit unsere Werke dort angezeigt werden, was viele neue Blickwinkel auf unsere Digitalisate eröffnet – insbesondere der direkte Vergleich von Seiten, Illustrationen oder ganzen Werken.

Wenn uns der OCR-Text zum Werk vorliegt, erscheinen drei weitere Download Links, einmal der Download der OCR der einzelnen Seite, der Download des gesamten Werkes im ALTO XML Format, sowie der gesamte Text des Bandes als einfache Text-Datei(.txt). Gerade die Letztere war ein vielfacher Wunsch, da sich dieser Text nicht nur einfach lesen und in den bevorzugten Editor einfügen lässt, auch Text-Mining-Projekte freuen sich über einfachen Text zur Verarbeitung. Weiterhin auf unserer Liste der geplanten Funktionen ist das Angebot von strukturiertem TEI.

Die jeweilige Lizenz der Werke findet sich ebenfalls sehr präsent im Download-View, sowie auf dem Info-View und dem PDF-Deckblatt. Unsere gemeinfreie Werke werden derzeit schrittweise auf eine Public-Domain-Auszeichnung umgestellt. Damit die Umgewöhnung für alle Nutzer leicht fällt, ist die komplette Download-Sektion für eine Übergangszeit im alten Toolbox-View gespiegelt.

Mehrsprachigkeit

Die Weboberfläche ist ab jetzt ebenso in Englisch verfügbar. Neben den Bedienflächen sind auch viele der Fachbegriffe übersetzt. Das schließt neben den Kategorien und Strukturtypen, in die sich unsere Digitalisierten Sammlungen gliedern, auch die einzelnen Standardelemente der Werke in den Inhaltsverzeichnissen und weitere Metadaten mit ein. Die eigentlichen Inhalte, wie Titel, Text und Autor, werden weiterhin in der Orginalsprache angezeigt.

Testen, testen, testen

Alle unsere neuen Funktionalitäten sind mit Softwaretests hinterlegt und in unsere Continuous IntegrationContinuous Deployment (CI / CD) – Strecke eingebunden. Wir tun unser Möglichstes, um die neuen Features fehlerfrei auszuliefern – aber es gibt auch andere Aufgaben und Projekte und damit eine begrenzte Zeit, die investiert werden kann. Deshalb an diese Stelle unsere Bitte: Probieren Sie unser neues Angebot aus und geben Sie uns hierzu Rückmeldungen. Wir freuen uns über alle Meinungen, positives wie negatives Feedback und natürlich über die Fehler, die wir nicht gefunden haben.

Neben diesem einleitenden Blogposting veröffentlichen wir dazu noch ein zweites, in dem ganz nüchtern alle Bereiche einzeln verzeichnet sind, in denen sich die aktuelle Beta von der Produktivinstanz unterscheidet. Entlang dieser Liste kann man testen – und dann unter diesem zweiten Artikel in den Kommentaren Rückmeldungen hinterlassen.

 

0 Antworten

Hinterlassen Sie einen Kommentar

Wollen Sie an der Diskussion teilnehmen?
Wir freuen uns über Ihren Beitrag!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.