Transkribathon ‚Faithful Transcriptions‘ – Annotation mittelalterlicher Handschriften in der Testumgebung des Handschriftenportals

Crowdsourcing und Citizen Science – die Aufarbeitung und Zugänglichmachung unseres Kulturerbes wird immer häufiger von engagierten Wissenschaftler:innen, Studierenden und anderen Interessierten unterstützt. Sie, die für die Sache brennen, investieren einen Teil ihrer Freizeit, um der institutionalisierten Forschung und Bestandshaltung unter die Arme zu greifen. Citizen Scientists entziffern Reisetagebücher, Dokumente zur Hansegeschichte oder – wie im hier vorgestellten Projekt – mittelalterliche Texte: Der aktuell stattfindende Transkribathon ‚Faithful Transcriptions‘ richtet sich insbesondere an Wissenschafter:innen und Studierende, die versiert im Lesen theologischer Handschriften des Mittelalters sind (oder es werden wollen) und Lust haben, unikale Überlieferungen für die Forschung zu öffnen.

Transkriptionen als Grundlagenforschung

Zahlreiche Handschriften warten auf engagierte Entdecker:innen, seien es Historiker:innen, Philologi:innen, mediävistische Kunsthistoriker:innen, Religionswissenschaftler:innen oder Digital Humanists. Bestimmte Fragestellungen können erst an Objekte einer Zeit herangetragen werden, wenn größere Korpora erschlossen und vervolltextet sind. Zwar wird die Digitaliserung von Handschriften und anderen Schriftträgern immer weiter vorangetrieben, doch öffnen sich diese digitalen Zwillinge mitunter nicht sofort. Es sind zunächst ‘nur’ Bilder, deren Inhalte erst durch Transkriptionsarbeiten bzw. Verschlagwortung durchsuchbar gemacht werden können.

Erst mit der Maschinenlesbarkeit überlieferter Texte lassen sich die Dokumente automatisiert auswerten; erst dann können computergestützte Analysemethoden wie Named-Entity-Recognition, historische Stilometrie oder Netzwerkanalysen angestellt werden. Und erst dann kann eine online verfügbare Sammlung überhaupt durchsucht werden.

Ziel des Transkribathons

Der von der Staatsbibliothek zu Berlin (SBB) und der Universitätsbibliothek Leipzig (UBL) ausgerichtete Transkribathon ‚Faithful Transcriptions‘ wird von Dr. Nicole Eichenberger und Dr. Hedwig Suwelack (beide SBB) geleitet. Primäres Ziel ist die Zugänglichmachung von Handschriften. Eichenberger und Suwelack haben daher einige der eindrucksvollsten Überlieferungsträger aus den Beständen der SBB und UBL ausgewählt, um sie via ‘Crowd Sourcing’ – also mit tatkräftiger Unterstützung einer Gruppe Freiwilliger – zu transkribieren.

Ganz nebenbei testen sie während der Transkriptionsphase einen Prototypen des zukünftigen Handschriftenportal-Annotationstools, der speziell für diesen Zweck implementiert wurde.

Einführung und Transkriptionsphase

Nach einführenden Tutorien in die Transkriptionsumgebung des Handschriftenportals und in die Text Encoding Initiative (TEI), bei denen auch Annika Schröer (UBL) und Torsten Schaßan (Herzog August Bibliothek Wolfenbüttel) mitwirkten, sprachen Prof. Dr. Andrea Rapp und Luise Borek (beide Technische Universität Darmstadt) über Digitale Perspektiven auf die Mediävistik.


Im Mai folgte eine vierwöchige Transkriptionsphase: Fast 80 Teilnehmer:innen meldeten sich für das Projekt an, dazu nahmen Studierende aus drei Seminaren teil. Den gesamten Monat über transkribierten damit ca. 100 Teilnehmer:innen die theologischen Handschriften und ergänzten sich in ihren Kompetenzen: Kunstwissenschaftler:innen konzentrierten sich auf die Beschreibung der Illuminationen, Philolog:innen auf die Transkription der Texte.

Die Transkription der Handschriften wurde in einem Annotationstool erfasst, das im Handschriftenportal-Projekt prototypisch entwickelt wurde. Nutzer:innen konnten hiermit Textbereiche oder Bildelemente auswählen und diese unter Berücksichtigung des einschlägigen TEI-XML-Tags annotieren. Die Elemente wurden dann automatisch in valides TEI-XML überführt.

    Bis Ende Juni werden die so gewonnenen ‘TEI-Schnipsel’ aufbereitet und ausgewertet. Die entstehenden Datenmengen werden nach Abschluss des Transkribathons im Datendienst der SBB, dem sogenannten SBB-Lab, zur Verfügung gestellt.

    Abschlussveranstaltungen

    Auch nach Abschluss der Transkriptionsphase boten und bieten die Veranstalterinnen ein Rahmenprogramm an, das zur virtuellen Diskussion über neueste Entwicklungen im Fach einlädt: Dr. Jakub Šimek (Universitätsbibliothek Heidelberg) sprach am 10. Juni über “heiEDITIONS: Die TEI an der Universitätsbibliothek Heidelberg”.


    Am 15. Juni folgte ein Vortrag von Dr. Christian Reul (Universität Würzburg), der die “Möglichkeiten und Grenzen einer Erfassung historischer Drucke und Handschriften” mit der Software OCR4all auslotete.

    Den Abschluss des dicht gepackten Transkribathons wird am 1. Juli 2021 ein runder Tisch bilden: Nach der Präsentation der Ergebnisse aus der Transkriptionsphase wird eine Podiumsdiskussion über “Aktuelle Perspektiven aus Geisteswissenschaften, Informatik und Digital Humanities” die Zukunft digitaler Forschung und ihrer Infrastruktur in den Blick nehmen. Dr. Christoph Mackert (UBL) wird das Gespräch moderieren, teilnehmen werden Prof. Dr. Racha Kirakosian (Universität Freiburg), Dr. Frederike Neuber (Berlin-Brandenburgische Akademie der Wissenschaften) und Leander Seige (UBL).

    In diesem Sinne: Ein Dankeschön an alle Teilnehmenden – ob als Transkribierende oder Vortragende! Projekte wie dieses ermöglichen die weitere Zugänglichmachung unseres kulturellen Erbes und in Konsequenz die Forschung darüber. Gleichzeitig möchten wir uns als Projektteam sowohl für die geduldige Arbeit mit dem Prototyp des Annotationstools bedanken als auch für das hilfreiche Feedback, das uns bisher erreichte und der weiteren Portalentwicklung dienen wird.

    0 Kommentare

    Ihr Kommentar

    An Diskussion beteiligen?
    Hinterlassen Sie uns einen Kommentar!

    Schreiben Sie einen Kommentar

    Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.