Beiträge zu Innovationen in unserem IT-Bereich

SBB LAB – Schaufenster für Daten, Demos & Experimente

Experimente, Mixturen, Versuche – Sie denken an Alchemie? Schon fast richtig, geht es doch im Folgenden um ein Labor oder, präziser, um ein Library Lab. Klar, dass dort nicht mit Säuren und Basen in Phiolen und Petrischalen hantiert wird, sondern vielmehr mit Daten und Informationen im virtuellen Raum. Und außerdem sind in diesem Fall Sie es, die aus kostenlosen Rohmaterialien Gold machen sollen.

Im Zuge der Massendigitalisierung des schriftlichen Kulturerbes sind inzwischen ganz erhebliche Datenmengen entstanden – wie aber können Bibliotheken dazu beitragen, die Nutzung, Transformation und Verknüpfung dieser Datenbestände zu befördern? Als ein so reizvoller wie zielführender Weg hat sich in jüngster Zeit das experimentelle Format des Hackathons – z.B. CodingDaVinci oder CodingGender – etabliert, mit dem das digitalisierte kulturelle Erbe auf neuartige, oft spielerische Weise erfahrbar gemacht wird. Denn Hackathons möchten partizipativ und hierarchiefrei dazu einzuladen, das kreative Potential offener gemeinfreier Datenbestände zu heben und einem breiteren Publikum zugänglich zu machen. Und wo ließe sich besser etwas ausprobieren als in einem Labor?

Building Library Labs

Diesen Stein ins Rollen brachte bereits 2008 die New York Public Library (NYPL). Unter dem Motto “NYPL Labs is an experimental design and technology team working to expand the range of interaction, interpretation, and reuse of library collections and data” versammelte die Website NYPL Labs eine Reihe von Angeboten mit einem gemeinsamen Anliegen – zu zeigen, für welch vielfältige Zwecke sich digitalisierte Bibliotheksbestände verwenden lassen. Auf diese Weise sollten gerade diejenigen Personengruppen erreicht werden, die sich gewöhnlich nicht auf den Webseiten einer Bibliothek umsehen würden. Die Seite ist inzwischen zwar archiviert, was jedoch einzig dem Umstand geschuldet ist, dass die NYPL derartige Aktivitäten zu einer ihrer Daueraufgaben gemacht und in den laufenden Betrieb integriert hat.

Auf europäischer Seite ließ man sich dagegen noch Zeit bis 2011, als die British Library mit Unterstützung der Andrew W. Mellon Foundation die Initiative British Library Labs (BL Labs) startete. Den Prinzipien von Transparenz und Offenheit verpflichtet, hat die British Library eine Informationsseite zur Entstehungsgeschichte von BL Labs eingerichtet, auf der die Anträge an die Mellon Foundation veröffentlicht sind. Dort ist nachzulesen, dass die Ziele von BL Labs die Öffnung von digitalisiertem Kulturerbe unter freien Lizenzen, die Interaktion mit diesen Daten sowie nicht zuletzt auch die berufliche Weiterentwicklung von Bibliothekspersonal im Hinblick auf die neuen digitalen Möglichkeiten beinhalten. Auch die Videoaufzeichnungen von Veranstaltungen der BL Labs geben einen Eindruck von der Vielfalt der Ideen und Anwendungen, die erst durch den freien Zugang zu offenen Kulturdaten möglich werden.

2014 folgte die Nationalbibliothek der Niederlande dem Beispiel der British Library und initiierte das KB Lab, während in den folgenden Jahren weitere Library Labs in den Nationalbibliotheken von Dänemark, Österreich, Spanien sowie den USA und Australien entstehen sollten. Das Team der BL Labs hat mittlerweile auch eine Mailingliste eingerichtet, auf der sich alle Interessierten zum Thema austauschen können. Wer auf Twitter unterwegs ist, findet unter dem Hashtag #buildlibrarylabs leicht Anschluss zur Community.

So fand dann auch im September 2018 ein erstes Treffen der weltweiten Library Labs Community an der British Library in London statt. Einen Kurzbericht zu den diskutierten Themen finden Sie im Blog der (dort ebenfalls vertretenen) europäischen Digitalen Bibliothek Europeana. Mit rund 60 Teilnehmenden aus allen Kontinenten war die Veranstaltung nicht nur gut besucht, sondern zeigte zudem, wie bei aller Vielfalt der Bibliotheken rund um die Welt doch die gemeinsame Motivation, besseren Zugang zu digitalisiertem Kulturerbe zu schaffen, verbindet. Im März 2019 traf sich die Building Library Labs Community zum zweiten Mal, diesmal an der Nationalbibliothek von Dänemark, dem sog. “Black Diamond”. Dort standen insbesondere Themen wie die Nachhaltigkeit von Library Labs, die Entwicklung von Bibliothekspersonal und -Services sowie die Organisation einer kollaborativen Buchpublikation zum Thema im Vordergrund.

Auch in Deutschland entwickelt sich aktuell eine recht diverse Labs Community an Bibliotheken. Beispiele sind die TIB Labs in Hannover oder die eher am Konzept eines Makerspace orientierten Angebote des LibraryLab der Zentralbibliothek der Stadtbüchereien Düsseldorf sowie der SLUB Dresden. Das DFG-Projekt “Future e-Research Support in the Humanities” (FuReSh) der Universitätsbibliothek der Humboldt-Universität Berlin erarbeitet aktuell eine Konzeptstudie für sog. “Scholarly Makerspaces”, ein Zwischenbericht dazu wurde in Ausgabe 35 von LIBREAS veröffentlicht.

Zum SBB-Lab

Da die Staatsbibliothek zu Berlin ihren Ursprung in einer kurfürstlichen Kunst- und Wunderkammer hat, ist es wohl nur folgerichtig, dass nun auch wir mit einem eigenen Lab an den Start gehen.

Im SBB-Lab werden unter dem Menüpunkt “DATEN” diverse Datensets sowie maschinenlesbare Schnittstellen (APIs) für die digitalisierten Bestände der SBB beschrieben. Zu jedem Datensatz finden sie im jeweiligen Eintrag auch Ansprechpersonen, die Ihnen bei Fragen dazu gerne weiterhelfen. Unter dem Menüpunkt “DEMOS” werden eine Reihe von Prototypen und Anwendungen vorgestellt, die im Zuge von kollaborativen Forschungsprojekten, Experimenten oder Hackathons entstanden sind. Diese wollen aufzeigen, was mit den verfügbaren Daten alles machbar ist und dazu inspirieren, selbst damit zu experimentieren. Da diese Datensets und Anwendungen zum Teil von anderen Einrichtungen bzw. Entwickler*innen erstellt wurden und ggf. auch extern gehostet werden, sind Änderungen der Funktionalitäten oder Instabilitäten allerdings nicht auszuschließen.

Sehen Sie sich doch selbst ein mal um: https://lab.sbb.berlin

Stimmen der Bibliothek: Künstliche Intelligenz, Robotik und Maschinenethik

Ein Beitrag aus unserer Reihe Künstliche Intelligenz zum Wissenschaftsjahr 2019

Ein Interview mit Prof. Dr. Oliver Bendel (informationsethik.net)

Künstliche Intelligenz (KI) wird zum Bestandteil unseres Arbeits- und Lebensalltags: Intelligente Objekt- und Mobilitätssteuerung, kooperative Roboter in der Industrie, KI bei der Sprachsteuerung mittels Assistenten, bei der Analyse unseres Online-(shopping-)Verhaltens oder als Bestandteil (teil-)autonomer Fahrzeuge. Manches fährt erkennbar daher, Einiges bleibt für viele von uns schwer zu erkennen und zu durchdringen.

Zu verbreiteten Lösungen in Produktion und Logistik treten vermehrt Szenarien und Anwendungen aus dem Service- und Dienstleistungsbereich hinzu: KI im Personalmanagement, bei der Verbrechensbekämpfung oder in Medizin, Pflege und Therapie, ergo Bereichen mit starken sozialen Interaktionen sowie besonderen Anforderungen an Datenschutz und Privatheit.

Wo stehen wir im Bereich der KI und sozialen Robotik, welche Auswirkungen kann dies auf die Gesellschaft bringen und welche Bedeutung spielen hierbei ethische Grundsätze?

Hören Sie im Interview mit Oliver Bendel, Professor für Wirtschaftsinformatik, Roboterphilosoph und Sachverständiger des Deutschen Bundestages, wie KI-Entwicklungen unser Leben bestimmen (werden) und wie sie Gegenstand in Forschung und Lehre sind.

Das Gespräch wurde am 21. Mai 2019 von Heinz-Jürgen Bove, Fachreferent für Sozialwissenschaften an der Staatsbibliothek zu Berlin, durchgeführt.

Weiterführende Links:

Gesichtserkennung am Südkreuz
Sozialkredit-Systeme
Stanford Robo Cop
Uncanny Valley
Boston Dynamics
Einstein-Born-Briefwechsel
Ron Arkin
Berliner Kolloquium Pflegeroboter
Armin Grunwald
Susan Leigh Anderson & Michael Anderson
Paro
Operationsroboter
Robear (Rieken)
Pepper
Enquetekommission KI des Bundestages
Uni-Klinikum Halle testet Pflegeroboter
Google Duplex
Goodbot, Liebot, Bestbot
Cleverbot
Google Assistant
Hiroshi Ishiguro
Joi (Blade Runner)
Gatebox
Mann heiratet Hologramm

 

Vorschau: Im nächsten Beitrag knüpfen wir an die historischen Vorläufer zur KI an, über die wir im Juni schon berichtet haben, und beleuchten die Thematik im literarischen Werk von E.T.A. Hoffmann.

QURATOR: Digitale Kuratierung mit Künstlicher Intelligenz

Ein Beitrag aus unserer Reihe Künstliche Intelligenz zum Wissenschaftsjahr 2019

Angesichts des stark wachsenden und fragmentierten Informationsangebotes müssen Inhalte in immer kürzerer Zeit für die digitale Publikation aufbereitet und publiziert werden. Vor diesem Hintergrund beteiligt sich die Staatsbibliothek zu Berlin an dem vom Bundesministerium für Bildung und Forschung (BMBF) im Programm Unternehmen Region geförderten Forschungsprojekt QURATOR: Curation Technologies.

QURATOR will dazu beitragen, Kuratierungstätigkeiten und die Generierung digitaler Inhalte  durch Automatisierung hochwertiger, effizienter und kostengünstiger zu gestalten und Wissensarbeiter*innen bei der Kuratierung digitaler Inhalte zu unterstützen. Eine wesentliche Grundlage dafür bilden Methoden auf Grundlage von Sprach- und Wissenstechnologien, Maschinellem Lernen (ML) und Künstlicher Intelligenz (KI).

Welche Rolle die Staatsbibliothek zu Berlin in diesem Projekt spielt, erläutert Clemens Neudecker, Forschungsreferent in der Generaldirektion, im Interview:

Woran arbeitet die Staatsbibliothek zu Berlin im Projekt QURATOR?

Die Staatsbibliothek zu Berlin digitalisiert alle Dokumente aus ihrem urheberrechtsfreien Bestand und stellt diese online zur Verfügung. Bevor man mit digitalisierten Quellen aber genauso komfortabel arbeiten kann, wie mit digital-born Dokumenten, sind zahlreiche komplexe Verarbeitungsschritte und technische Herausforderungen zu meistern. Im QURATOR Teilprojekt „Automatisierte Kuratierungstechnologien für das digitalisierte kulturelle Erbe“ beschäftigt sich die Staatsbibliothek zu Berlin mit zwei dieser grundsätzlichen Herausforderungen: Zum einen soll die Qualität der Digitalisierung durch KI-basierte Verfahren  verbessert werden, zum anderen soll die Effizienz der Kuratierung mithilfe automatisierter Verfahren deutlich steigen. Ziel ist es, dass künftig mehr Dokumente schneller und besser erschlossen und damit auch leichter recherchierbar werden.

Welche Anwendungsszenarien werden konkret entwickelt?

Konkret haben wir in QURATOR mit den Arbeiten an drei Kernaufgaben begonnen:

  1. Für die Qualitätsverbesserung ist es wichtig, überhaupt erst einmal zu verstehen, wo die Probleme auftreten und welche Stellschrauben zur Verfügung stehen. So werden in einem ersten Schritt sämtliche Metadaten und Volltexte der an der Staatsbibliothek zu Berlin vorhandenen Digitalisate untersucht um durch Clustering und Profiling Problemklassen zu identifizieren. In einem nächsten Schritt werden die für die Problemklassen entscheidenden Merkmale extrahiert und spezifisch dafür Lösungen entwickelt.
  2. Die Strukturerkennung stellt einen weiteren entscheidenden Schritt in der Dokumentenanalyse dar. Hierbei geht es darum Strukturen des Layout wie bspw. Spalten, Überschriften, Marginalien und dergleichen zu erkennen und als solche zu klassifizieren. Dafür werden aktuell Convolutional Neural Networks (CNN) auf der Basis von ResNet-50 trainiert.
  3. Auch im Bereich der Eigennamenerkennnung (Named Entity Recognition, NER) nutzen wir die Möglichkeiten der KI. Während bisherige Ansätze eher statistisch oder regelbasiert arbeiten, setzen wir hierfür auf Bidirectional Encoder Representations from Transformers (BERT), ein von Google auf Millionen von Texten vortrainiertes Neuronales Netz bzw. Modell, das nun auf den Digitalisaten der Staatsbibliothek zu Berlin für die Besonderheiten der historischen Rechtschreibung im Deutschen nachtrainiert wird.

Welche Innovationen verbinden sich damit?

Die zu erwartenden technologischen Innovationen bestehen in erster Linie darin, die vielversprechenden Ansätze aus dem Bereich der KI/des maschinellen Lernens auf die besonderen Anforderungen von historischen Dokumenten zu adaptieren. Da hierbei insbesondere die Verfügbarkeit von großen Mengen von Trainingsdaten eine wichtige Rolle spielt, ist die Staatsbibliothek zu Berlin aber mit aktuell rund 2,5 PetaBytes an Daten gut gerüstet.

Aktuell arbeiten wir bereits in weiteren Forschungsprojekten mit Technologien wie Künstlicher Intelligenz – so z.B. in dem von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekt OCR-D. Dort werden momentan im Bereich der Texterkennung (OCR) dank KI Durchbrüche erzielt, die vor wenigen Jahren noch undenkbar waren, wie bspw. die qualitativ hochwertige Verarbeitung von historischen Drucken oder sogar die automatische Erkennung von Handschriften.

Wie sieht die Bibliothek der Zukunft aus?

Vom Bücherspeicher zur Informationsinfrastruktur: Bibliotheken sind wie kaum ein anderes Feld vom digitalen Wandel betroffen. Die Digitale Transformation krempelt dabei viele etablierte Geschäftsprozesse einer Bibliothek grundlegend um. An die Stelle von unstrukturierten Daten sollen schlussendlich strukturierte Inhalte treten.

Darüber hinaus gibt es mit dem Forschungsbereich der „Digital Humanities“ seit einigen Jahren einen stark wachsenden Kreis von Forscher*innen, die mit großen Mengen von digitalisierten Beständen aus dem Kulturbereich und digitalen Methoden an neuen Forschungsfragen arbeiten. Die Staatsbibliothek zu Berlin erweitert hier konsequent ihre Kompetenzen und baut auch entsprechende Partnerschaften auf und aus.

Vorschau: „Von der Zukunft zurück in die Vergangenheit: Im nächsten Beitrag beleuchten wir die Geschichte der Automaten und den Maschinenglauben der Menschen aus der Frühen Neuzeit – sozusagen die ersten Experimente auf dem Weg zur Künstlichen Intelligenz.“