Zur Infrastruktur des Handschriftenportals –
Entwicklung, Hosting und Langzeitverfügbarkeit

Ein Interview zwischen Konstantin Görlitz und Carolin Hahn (beide SBB).

Eigentlich sieht alles ganz einfach aus: Ruft man die Testumgebung des künftigen Handschriftenportals auf, öffnet sich ein virtueller Katalog inkl. Arbeitsplatz, in dem erste Funktionalitäten ausprobiert und Beispieldatensätze recherchiert werden können. Wenngleich die aktuell verfügbaren Funktionen nur einen ersten Einblick erlauben, steht hinter der Oberfläche schon jetzt eine komplexe Infrastruktur, die entwickelt, gewartet und natürlich auch gesichert werden muss.

Das Handschriftenportal ist ein Konglomerat aus verschiedenen Modulen, die jeweils ganz unterschiedliche Funktionen erfüllen und dennoch erfolgreich miteinander ‘kommunizieren’ müssen. Letzteres gilt natürlich auch für die Entwickler:innen, denn die Projektmitarbeiter:innen arbeiten an vier verschiedenen Standorten in ganz Deutschland – und pandemiebedingt mitunter aus dem Homeoffice heraus. Verschiedene institutionelle Zugriffspunkte und -rechte sind dabei nur zwei von zahlreichen Herausforderungen, die gemeistert werden müssen und Abstimmung verlangen.

Konstantin Görlitz (SBB) berichtet, aus welchen Grundbausteinen das Handschriftenportal besteht, wie gewährleistet wird, dass Entwicklungsarbeiten letztendlich in einem einzigen Portal zusammenfließen können – und wie das Handschriftenportal auch nach Projektende betreut wird.

Steckbrief

Name:
Konstantin Görlitz (SBB)

Rolle im Projekt:
DevOps, Softwareentwickler

Institutionelle Anbindung:
Abteilung Informations- und Datenmanagement der SBB
Mitarbeiter im Sachgebiet „Management fachspezifischer Nachweissysteme und Datenbanken“

1. Zahlreiche Handschrifteninteressierte haben bereits die aktuelle Testumgebung (alpha.handschriftenportal.de) ausprobiert und Feedback zu den ersten Funktionalitäten gegeben. Wie ging es seitdem weiter?

Um einen möglichst großen Informationsgehalt für das Projekt zu generieren, wurde das gemeldete Feedback zuerst ausgewertet und kategorisiert. Jetzt müssen wir entscheiden, was davon wichtige Verbesserungsvorschläge oder funktionale Fehler sind, die noch behoben werden müssen – und welche Punkte einfach nur kosmetische Änderungen betreffen. Die Projektleitung wird nun entscheiden, was wir umsetzen und in welcher Reihenfolge. Wichtig ist auch die bisherige Meilensteinplanung, mit der bereits die meisten Entwicklungsressourcen gebunden sind. Im Endeffekt wird es eine Zeit- und Kostenfrage sein, die darüber entscheidet, welche Features umgesetzt werden können.

2. Wie würden Sie Ihre Rolle im Projektzusammenhang beschreiben? Wofür genau sind Sie verantwortlich?

Im Handschriftenportal übernehme ich gleich zwei Rollen: Zum einen bin ich Softwareentwickler und wirke bei der Neuentwicklung von Softwarekomponenten mit. Meine zweite Rolle ist die eines ‘DevOps’, der Begriff setzt sich aus den Bausteinen ‘Development’ und ‘IT Operations’ zusammen. Meine Aufgabe ist hier – einfach gesagt – die Bereitstellung von Infrastruktur, die direkt für die Softwareentwicklung benötigt wird. Dazu zählen Tools wie Jenkins, mit dem automatisch Softwarekomponenten gebaut und getestet werden können. Gemeinsam mit den anderen Entwickler:innen legen wir Qualitätsziele fest und lassen diese auswerten. Damit wir erste Funktionstests unserer Software durchführen können, muss eine Testumgebung bereitgestellt werden.

Sobald neue Funktionen implementiert und getestet sind, werden diese für die Fachabteilung auf der sogenannten Stage-Umgebung bereitgestellt. Sie dient der Endabnahme von Release-Kandidaten, die später für die breite Öffentlichkeit freigeschaltet werden. Der Aufbau, die Installation und die Pflege dieser Systeme fallen somit in ein Ressort.

Da ich auch eine zentrale Schnittstelle zwischen Entwicklerteams und Infrastruktur bilde, gehört gerade hier ein hohes Maß an Kommunikation zu meinen Aufgaben. Entscheidungen müssen kommuniziert, Infrastrukturvorhaben weitergegeben und Entwicklungsvorgaben vermittelt werden. Mit zwei lokal verteilt arbeitenden Entwicklerteams – wir kooperieren mit der UB Leipzig – muss man natürlich besonders aufpassen, dass man nicht den Überblick verliert und jeder auf dem gleichen Kenntnisstand ist.

3. Konrad Eichstädt (SBB) berichtete im letzten Jahr, aus welchen Modulen das Handschriftenportal bestehen wird. Vielleicht können wir hieran anknüpfen, denn gerade nach dem nun erfolgten Launch der Testumgebung ist so manche Funktion ‚plastischer‘ und nachvollziehbarer geworden. Welche Funktionalitäten wurden bereits in einem ersten Entwurf umgesetzt – und welche befinden sich in Planung?

Das derzeitige Testsystem des Handschriftenportals besitzt zwei Einstiegspunkte, später werden beide über eine gemeinsame Oberfläche erreichbar sein: Zunächst die Suche, die frei zugänglich ist und eine leicht zu bedienende Arbeitsfläche bieten soll. In der Testumgebung haben wir bereits einige Funktionen umgesetzt wie die Suche mittels Solr Index. Diese Technologie macht sehr schnelle Suchen möglich. Mit dem angeschlossenen Mirador-Viewer, dem sogenannten Arbeitsplatz, wurde ein Bereich zur Betrachtung von Metadaten und IIIF integriert. Die von den Einrichtungen gelieferten Metadaten und Digitalisate können hier zusammengeführt und in verschiedenen Layouts betrachtet werden.

Der zweite Einstiegspunkt ist die Nachweiskomponente, sie dient den Redakteur:innen zum Erstellen und Editieren von Handschriftenmetadaten sowie zum Verknüpfen der entsprechenden Digitalisate. Es ist bereits möglich, Daten im Format MXML und TEI-XML zu importieren. Dabei wird automatisch geprüft, ob die gelieferten Dokumente auch valide sind. Erst nach der erfolgreichen Annahme landen sie im Portal und sind durchsuchbar. Die Datenhaltung wird im Hintergrund durch SQL-Datenbanken gewährleistet, sie bieten eine hohe Datensicherheit. Für eine bessere Performance bei der Suche nutzen wir Solr.

Wenn eine:r Nutzer:in jetzt eine Suchanfrage stellt, muss in den vom Nachweis bereitgestellten Daten ‘nachgesehen’ werden, ob der gesuchte Begriff existiert und welche Metadaten und Digitalisate dazu angezeigt werden können. Unsere Lösung dafür heißt ‘Kafka’, das ist ein sogenannter Message Broker, der die Informationen schnell vom Nachweis in die Suche bringt.

Im nächsten Schritt wollen wir einen Editor zur Einspeisung der Handschriftenmetadaten sowie die Rechteverwaltung bzw. Logins für die verschiedenen Nutzer:innengruppen entwickeln. So können sich Erschließer:innen und Mitarbeiter:innen handschriftenbesitzender Institutionen direkt im System anmelden und die eigenen Daten bequem pflegen.

4. Nun ist das System ‘das Eine’, die konkreten Recherchedaten und Digitalisate sind das Andere. Wie bzw. wo genau werden diese Inhalte heute und in Zukunft gepflegt?

Die Staatsbibliothek zu Berlin hat sich nicht nur dazu bereit erklärt, an der Entwicklung mitzuwirken, sondern wird auch die weitere Bereitstellung und Wartung des Systems übernehmen. Erschließer:innen und handschriftenbesitzende können ihre Katalogdaten in das System einpflegen, diese Metadaten werden von der SBB gehostet. Für IIIF-fähige Digitalisate, die über ein IIIF-Manifest verfügen und direkt im Arbeitsplatz angezeigt werden können, ist es andersherum: Diese Daten verbleiben bei den einzelnen Einrichtungen und werden dort gehostet. Der Zugriff aus dem Handschriftenportal heraus wird dann über Schnittstellen (APIs) gesteuert, die Verantwortung für die Bildmetadaten bzw. Digitalisate liegt bei den jeweiligen Institutionen. Hier unterstützt jedoch die Universitätsbibliothek Leipzig bei Bedarf kleinere Kultureinrichtungen, die selbst keine eigene IIIF-Infrastruktur aufbauen können.

5. Das Handschriftenportal wird dankenswerterweise von der DFG gefördert. Wer wird das Portal nach Projektende weiterbetreiben?

Die SBB hat sich mit großem Einsatz an dem Projekt beteiligt und wird den Betrieb des Handschriftenportals auch nach Beendigung des Projekts sicherstellen. Der diesbezügliche Aufwand ist hierbei höher als bei bisherigen Services, die aus Projekten hervorgingen: Nicht nur die Hardware muss bereitgestellt werden, auch Langzeitkosten für Backups fallen an. Zudem bedeuten Serviceleistungen und die Wartung hohe Arbeitsaufwände.

6. Wie werden Sie die Langzeitverfügbarkeit und funktionale Betreuung sicherstellen?

Die Abteilung Informations- und Datenmanagement der SBB ist bereits vertraut mit der Betreuung von fachspezifischen Nachweissystemen und wird diese Aufgabe auch für das Handschriftenportal übernehmen. Das Entwicklerteam wird sich um die Behebung von Bugs und die Wartung kümmern. Das Portal wird in die bestehende Infrastruktur der SBB eingebunden, dazu gehören auch Monitoring und Backup.

7. Was waren die bisher größten Herausforderungen?

Für mich besteht die größte Herausforderung – oder eher gesagt der ‘Aufwand’ – in der Kommunikation mit den einzelnen Entwicklerteams. Wie bereits von Konrad Eichstädt beschrieben, haben wir uns für eine Microservice-Architektur entschieden, in der mehrere verteilte Systeme zusammengeführt werden. Dies wird noch potenziert durch das zweite Entwicklerteam der UB Leipzig, mit dem wir uns täglich austauschen. Jede einzelne Komponente muss sehr gut dokumentiert und auch von den Beteiligten durchdrungen werden, was bei der Vielzahl an Technologien gar nicht so leicht ist. Auch benötigen die externen Entwickler:innen Zugriff auf unsere internen geschützten Systeme, was schon vor Covid-19 eine Herausforderung war.

8. Ein Blick in die nahe Zukunft: Stehen morgen konkrete Aufgaben im Projektkontext an? Welche sind das?

Ich beschäftige mich derzeit mit der Einbindung eines Authentifizierungs- und Autorisierungsservices (IMD). Erfasser:innen und Redakteur:innen sollen im Nachweis unterschiedliche Rechte erhalten, was sich auch in der Funktionalität widerspiegeln soll. Der IMD-Service wird in alle Module des Handschriftenportals eingebunden, um eine hohe Sicherheit zu gewährleisten. Parallel wird am Erfassungseditor weitergearbeitet, um eine bessere Übersicht und Usability für die zukünftigen Nutzer:innen zu bieten.

0 Kommentare

Ihr Kommentar

An Diskussion beteiligen?
Hinterlassen Sie uns einen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.