Beiträge

Hackathon@SBB: Coding Gender – Diversity in historischen Kulturdaten

Diversity sichtbar machen – das ist das Anliegen des Deutschen Diversity-Tags, der heute zum siebten Mal stattfindet. Mit einer Reihe von öffentlichen und internen Aktionen lenken verschiedene Institutionen und Unternehmen die Aufmerksamkeit auf Vielfalt und Sichtbarkeit. Das ist uns auch in der Staatsbibliothek ein Anliegen! Deshalb organisieren wir vom 28.-30. August 2019 eine ganz besondere Veranstaltung: Den Kultur-Hackathon „Coding Gender – Women in Cultural Data“!

Bibliotheken sind offene Orte, an denen sich Nutzende mit unterschiedlichsten persönlichen Hintergründen begegnen. Um Teilhabe zu ermöglichen, garantieren Bibliotheken – in Anlehnung an Artikel 5 des gerade siebzig Jahre altgewordenen Grundgesetzes – Zugang zu Bildung und einem breiten Spektrum von Informationen.

Trotzdem zeigen sich die Ungleichheiten der Geschichte auch in unserem Medienbestand und wir wollen den Blick auf einen dieser – teilweise historisch bedingten – Problemfälle lenken: Die Rolle von Frauen und deren Sichtbarkeit in Kulturdaten. Deshalb wollen wir wissen, wo wir in Bibliotheken auf Geschlechter-Stereotype stoßen und wie Gender in historischen Dokumenten konstruiert und repräsentiert wird.

Mit dem Hackathon versuchen wir uns an einem neuen und unvoreingenommenen Blick auf Kulturdaten, der spielerisch und kreativ neue Perspektiven eröffnet. Dafür stellen wir Datensets aus historischen Kulturobjekten zusammen, d.h. Digitalisate von Büchern, Briefen, Portraits und vieles mehr. Inhaltlich liegt der Schwerpunkt auf den Themen Gender, Feminismus, Konstruktion, Normierung und Transgression von Geschlechterrollen.

Damit aus Daten aber ein Hackathon werden kann, freuen wir uns auf Teilnehmer*innen, die Lust haben, kreativ und innovativ mit diesen Datensets zu arbeiten. Deshalb laden wir Entwickler*innen, Kreative, Wissenschaftler*innen und Kulturinteressierte ein, vom 28.-30. August in interdisziplinären Teams bei uns zusammenzuarbeiten!

Interessiert? Weitere Informationen zur Veranstaltung und Anmeldung hier.

Formate, Bilder, Sicherheit – Die neue Beta der Digitalisierten Sammlungen

Meistens läuft ein Update unserer Digitalisierten Sammlungen eher still ab. Neue Features werden eingespielt, Bugs werden gefixt und intern wird getestet. Tagesgeschäft halt. Inzwischen ist aber soviel passiert, dass wir etwas umfangreicher davon erzählen wollen. Und wir möchten alle NutzerInnen dazu einladen zu testen, Fehler zu finden und Anmerkungen zu geben. Denn die Beta soll bald produktiv gehen und die neuen Features für alle zur Verfügung stehen, damit im Anschluss die neue Beta entstehen kann.

Alles sicher

Die Digitalisierten Sammlungen wurden komplett auf https – also eine sichere, verschlüsselte Verbindung – umgestellt. Das haben wir erst mit dem Beta-Portal getestet, fanden es aber so wichtig, dass wir es auf dem produktiven Portal ebenso implementiert haben. Die Umstellung betrifft nicht nur den Server der die Präsentation an sich ausliefert, sondern auch den Content-Server, der für die Auslieferung unserer Bilder zuständig ist, sowie weitere Hintergrunddienste.

Alle nun folgenden Änderungen kann man hingegen nur unter dieser Adresse ausprobieren:

 

 

Bildauslieferung nach iiiF-Standard

Es beginnt mit dem Content-Server – dieser wurde neu entwickelt. Der bisherige Content-Server war mit dem Framework Node.js® umgesetzt. Bei der Neuimplementierung haben wir uns ebenfalls für diese Technologie entschieden und auf das Web Framework koa aufgesetzt.
Der Hauptgrund für die Umstellung war die Anpassung der Auslieferung der Bilder mittels des relativ neuen iiiF-Standards. Das International Image Interoperability Framework™ ist ein internationaler Standard für den Zugriff auf Bilder und das Handling der Metadaten für diese Bilder. Das erlaubt uns unsere Bilder und Metadaten noch besser mit anderen Institutionen teilen zu können, sofern diese ebenfalls auf diesen Standard setzen, was immer mehr Institutionen weltweit machen. Weiterhin erlaubt der Einsatz von Standards eine Nutzung von weiteren Projekten, die diesen Standard implementieren, wozu bspw. der iiiF-Viewer Mirador gehört.
Unser Content-Server kann etwas mehr, er implementiert neben der iiiF Image API eine Reihe weiterer Funktionen, die speziell zu unserem Stack der Digitalisierten Sammlungen gehören.
Das Beispiel zeigt ein auf 500 Pixel Breite verkleinertes Bild, das um 90 Grad gedreht in Graustufen ausgeliefert wird. Einen kurzen technischen Einblick erhält man in der NGCS routes Dokumentation, eine tiefer gehende Betrachtung der technischen Umsetzung innerhalb der Software, ist einen eigenen Beitrag wert.

Mehr Werkzeuge

Klicken Sie auf das Bild, um die Bildfilter jetzt zu testen.

Unser Werkzeugkasten hat sich erweitert. Neben einem zusätzlichen Zoom-Slider bieten wir nun einen eigenen Bereich für Bildmanipulationen. Damit lässt sich das Bild auf vielfältige Weise neu erforschen: bestimmte Bereiche können durch eine Erhöhung des Kontrastes verdeutlicht, Farben zur Veränderung des Gesamteindruckes angehoben oder abgeschwächt werden. All diese Veränderungen können für das einzelne Werk gespeichert werden und gelten dann für jedes weitere Bild, das über die Navigation innerhalb dieses Werkes aufgerufen wird.

Neuer Download-Bereich

Viele NutzerInnen wollen nicht nur online durch unsere Werke stöbern, sondern sich die Digitalisate in voller Qualität auch auf den eigenen Rechner laden. Der hierfür vorgesehene Downloadbereich ist mittlerweile so umfangreich geworden, dass er einen eigenen View verdient hat. Das neue Icon ist nach der häufigsten Anfrage an unseren Support benannt: “Wo befindet sich der PDF-Download?”, und nun hoffentlich gut genug in Szene gesetzt.

Der PDF-Download selbst hat derzeit noch kein Face-Lifting erhalten und ist weiterhin eine Client-seitige Lösung, was bedeutet: welche Anzahl und wie groß die Bilder innerhalb des PDFs sein können, hängt in großem Maße von dem Rechner ab, an dem man den PDF-Download startet. Weiterhin gibt es wie gewohnt die unkomplizierte Möglichkeit sich alle Bilder oder einzelne Abschnitte in hoher Qualität als ZIP-Datei herunterzuladen und damit selbst die Formate auf seinem Rechner zu erstellen, die für die eigene Arbeit gewünscht werden.

Neben der METS-Datei, die alle Metadaten enthält, ist es nun auch möglich diese als iiiF Manifest abzurufen. Dieses im JSON-LD Format gehaltene Dokument entspricht der iiiF Presentation API und bringt unsere Metadaten in neuer Form in die Welt. In iiiF kompatiblen Viewern, wie Mirador, können URI’s zu dem Manifest geladen und damit unsere Werke dort angezeigt werden, was viele neue Blickwinkel auf unsere Digitalisate eröffnet – insbesondere der direkte Vergleich von Seiten, Illustrationen oder ganzen Werken.

Wenn uns der OCR-Text zum Werk vorliegt, erscheinen drei weitere Download Links, einmal der Download der OCR der einzelnen Seite, der Download des gesamten Werkes im ALTO XML Format, sowie der gesamte Text des Bandes als einfache Text-Datei(.txt). Gerade die Letztere war ein vielfacher Wunsch, da sich dieser Text nicht nur einfach lesen und in den bevorzugten Editor einfügen lässt, auch Text-Mining-Projekte freuen sich über einfachen Text zur Verarbeitung. Weiterhin auf unserer Liste der geplanten Funktionen ist das Angebot von strukturiertem TEI.

Die jeweilige Lizenz der Werke findet sich ebenfalls sehr präsent im Download-View, sowie auf dem Info-View und dem PDF-Deckblatt. Unsere gemeinfreie Werke werden derzeit schrittweise auf eine Public-Domain-Auszeichnung umgestellt. Damit die Umgewöhnung für alle Nutzer leicht fällt, ist die komplette Download-Sektion für eine Übergangszeit im alten Toolbox-View gespiegelt.

Mehrsprachigkeit

Die Weboberfläche ist ab jetzt ebenso in Englisch verfügbar. Neben den Bedienflächen sind auch viele der Fachbegriffe übersetzt. Das schließt neben den Kategorien und Strukturtypen, in die sich unsere Digitalisierten Sammlungen gliedern, auch die einzelnen Standardelemente der Werke in den Inhaltsverzeichnissen und weitere Metadaten mit ein. Die eigentlichen Inhalte, wie Titel, Text und Autor, werden weiterhin in der Orginalsprache angezeigt.

Testen, testen, testen

Alle unsere neuen Funktionalitäten sind mit Softwaretests hinterlegt und in unsere Continuous IntegrationContinuous Deployment (CI / CD) – Strecke eingebunden. Wir tun unser Möglichstes, um die neuen Features fehlerfrei auszuliefern – aber es gibt auch andere Aufgaben und Projekte und damit eine begrenzte Zeit, die investiert werden kann. Deshalb an diese Stelle unsere Bitte: Probieren Sie unser neues Angebot aus und geben Sie uns hierzu Rückmeldungen. Wir freuen uns über alle Meinungen, positives wie negatives Feedback und natürlich über die Fehler, die wir nicht gefunden haben.

Neben diesem einleitenden Blogposting veröffentlichen wir dazu noch ein zweites, in dem ganz nüchtern alle Bereiche einzeln verzeichnet sind, in denen sich die aktuelle Beta von der Produktivinstanz unterscheidet. Entlang dieser Liste kann man testen – und dann unter diesem zweiten Artikel in den Kommentaren Rückmeldungen hinterlassen.