Gesichtserkennung für Ochsenköpfe – Erprobung und Einsatz von Computer Vision für die Bestimmung historischer Wasserzeichen

Aufgrund der globalen Verbreitung sowie des universalen Einsatzes des Beschreibstoffs Papier zählt die Bestimmung von Wasserzeichen seit langem nicht nur zu den festen Bestandteilen der wissenschaftlichen Erschließung vormoderner Handschriften und Drucke aus unterschiedlichsten Textkulturen, sondern darüber hinaus zum etablierten Methodenrepertoire nahezu aller mit historischen Schrift- und Bildquellen arbeitenden Disziplinen. Denn der Abgleich von Wasserzeichen in unfirmierten Vorlagen mit bereits datierten bzw. lokalisierten Bildmarken ermöglicht es, den zeitlichen wie räumlichen Entstehungskontext des betreffenden Manuskripts oder Drucks zu ermitteln oder sogar genuine Werkstattzusammenhänge zu rekonstruieren.

Allerdings erschweren große Ähnlichkeit und Variantenreichtum der meist aus mehreren Elementen zusammengesetzten Motive, wie sie seit dem Mittelalter von europäischen Papiermühlen zur Kennzeichnung ihrer Produkte verwendet wurden, die Identifikation von Wasserzeichen ganz erheblich – namentlich der in tausenden Versionen dokumentierten Marken Ochsenkopf und Buchstabe P. Zusätzlich gesteigert wird die Komplexität des Bildabgleichs noch dadurch, dass sämtliche Nachweisportale zur Referenzierung von Wasserzeichen auf präkombinierten monohierarchischen Klassifikationen basieren, in denen ähnliche Motive an unterschiedlichen Systemstellen ihren Ort haben können. So findet sich im Wasserzeichen-Informationssystem (WZIS) etwa das Motiv Horn im Kreis sowohl in der Kategorie Musikinstrumente als auch unter Geometrische Figuren. Grund für diese Erfassung wie Recherche von Wasserzeichen gleichermaßen behindernde Inkonsistenz ist das Fehlen verbindlicher Regeln, ob im Beispielfall das Motiv Kreis als zentrale Bildkategorie (Geometrische Figuren) oder lediglich als Rahmung des eigentlichen Hauptmotivs (Horn) zu betrachten ist.

Angesichts dieser Problematik wurde bereits mehrfach von Seiten sowohl der historischen Grundwissenschaften als auch der Digital Humanities das Desiderat angemahnt, maschinelle Mustererkennung für die Identifikation von Wasserzeichen in historischen Schrift- und Bildquellen einzusetzen. Denn gerade den Abgleich nur schwer zu bestimmender Vorlagen könnte ein solches Softwaretool signifikant erleichtern, indem es aus der Fülle der in den materialspezifischen Datenbanken wie WZIS oder Wasserzeichen des Mittelalters (WZMA) – da auf unterschiedlichen Wegen erzeugt – in variierender Bildqualität nachgewiesenen Referenzbelege eine Auswahl der ähnlichsten Marken vorschlägt.

Angesichts der Beachtung, die die Erkennung identischer Wasserzeichen als informatisches Problem seit Jahrzehnten findet, erstaunt es allerdings umso mehr, dass eine praxistaugliche wissenschaftsadäquate Technologie für die automatische filigranologische Analyse nach wie vor aussteht – den zahlreichen Projektinitiativen auf diesem Feld zum Trotz. „Watermark retrieval remains a challenge“, wie Forschende der Universität Oxford und des britischen Nationalarchivs diesen Befund zuspitzen, der letztlich der nur eingeschränkten Eignung präkombinierter monohierarchischer Klassifikationen zur Systematisierung komplexer und namentlich kompositer Bildinhalte geschuldet sein dürfte.

Um dieses Defizit zu adressieren und zugleich das Fundament für den avancierten Einsatz von Computer Vision zur automatischen Wasserzeichenbestimmung zu legen, wurde aus der Staatsbibliothek zu Berlin (Stabi) alternativ ein Konzeptentwurf für eine filigranologische Ontologie vorgeschlagen, die Bildmarken unter Segmentierung ihrer Teilmotive facettiert in den Blick nimmt – ein Ansatz, der sich auch auf andere buchwissenschaftliche Anwendungsszenarien algorithmischer Mustererkennung wie die Identifikation von Einbandstempeln oder Druckermarken anwenden lässt. Als besonders aussichtsreich erscheint dabei der Dialog mit der Heraldik, entspricht doch der komposite, aus mehreren Segmenten kombinierte Bildaufbau von Wappen strukturell demjenigen von Wasserzeichen. Hinzu kommen die vergleichbar weite, nach abertausenden Exemplaren zählende Verbreitung beider Quellengattungen sowie das daraus bedingte massenhafte Auftreten sich nur marginal unterscheidender Bildmotive.

An dieser Stelle setzt das frisch von der Deutschen Forschungsgemeinschaft (DFG) bewilligte Projekt Gesichtserkennung für Ochsenköpfe: Erprobung und Einsatz von Computer Vision für die Bestimmung historischer Wasserzeichen an eine gemeinsame Initiative der Stabi sowie der Professur für Digital History der Humboldt-Universität zu Berlin mit ihrem Forschungsschwerpunkt auf dem Feld der digitalen Heraldik. Konkret verfolgt dieses kooperative Vorhaben drei Ziele:

Erstens die quelloffene Entwicklung eines wissenschaftsadäquaten automatischen Bildanalyseinstruments auf Basis von KI, das durch Vorschlag der Belege mit der höchsten Übereinstimmungsrate Forschenden gerade bei der Identifikation mit bloßem Auge kaum zu unterscheidender Wasserzeichen assistieren soll. Der innovative Impuls dieser als Webservice zur funktionalen Erweiterung der diversen Nachweisinstanzen für Wasserzeichen, Handschriften und Drucke zu realisierenden Anwendung – allen voran von WZIS sowie perspektivisch auch des von der Stabi mitverantworteten Handschriftenportals – besteht in der facettierten Indexierung der verschiedenen Bildmarken unter Segmentierung ihrer Teilmotive auf Grundlage einer Ontologie.

Zweitens geht es dem Projekt um die weitere Ausdifferenzierung der im Zuge der anstehenden technischen Modernisierung von WZIS zu konzipierenden Basisontologie für die Klassifikation von Wasserzeichen. Die ontologiebasierte Systemarchitektur des geplanten Computer Vision-Werkzeugs eröffnet nämlich erstmals die Chance, nicht nur Wasserzeichenfragmente verlässlich zu bestimmen, sondern auch die Inhalte der filigranologischen Referenzportale per Mapping in den maschinellen Bildabgleich einzubeziehen. Aufgrund der weiten Verbreitung der WZIS-Klassifikation – u.a. als Fundament des europäischen Verbundportals Bernstein – soll der Transfer ihrer multilingualen Terminologie auf die Wasserzeichenontologie als exemplarisches Anwendungsszenario dienen. Im Interesse der Dateninteroperabilität ist dabei die Robustheit der eingesetzten Bilderkennungstechnologie gegenüber den vielfältigen Erscheinungsformen in variierender Qualität der zu identifizierenden Vorlagen von zentraler Bedeutung, werden doch Wasserzeichen in ihrer materialen Spezifik bzw. in Abhängigkeit der lokalen Ressourcen seit jeher mit unterschiedlichen Verfahren abgenommen – vorrangig per Abreibung, Durchzeichnung, Infrarotaufnahme, Thermographie oder neuerdings auch Multispektralbildgebung

Als qualitätsgesichertes Benchmarking-Datenset zur Evaluierung des angestrebten Bilderkennungswerkzeugs wie auch als freie Ressource für die Computer Vision-Forschung im Allgemeinen soll ein Korpus von Wasserzeichenreproduktionen aus dem mitteleuropäischen Raum der Vormoderne dienen, dessen Erstellung und Open Access-Publikation das dritte Projektziel markiert. Dabei muss das aus verschiedenen, überwiegend unerschlossenen Sammlungsbereichen der Stabi zu aggregierende Datenset Repräsentativität sowohl hinsichtlich der materialen Spezifik der ausgewählten Wasserzeichen beanspruchen können als auch bezüglich der genannten gängigsten Reproduktionsverfahren. In diesem Zusammenhang möchte das Vorhaben erstmals das Potential von Multispektralbildgebung für die Reproduktion von Wasserzeichen systematisch erproben und daraus objekt- bzw. materialspezifische Handlungsempfehlungen und Entscheidungshilfen für den effizienten Einsatz konventioneller bzw. avancierter Abnahmeverfahren in der filigranologischen Praxis ableiten. Denn die jeweilige Materialität des mit Wasserzeichen versehenen Artefakts stellt eigene Anforderungen an den technischen Bildgebungsmodus. Perspektivisch soll der daraus zu erwartende Standardisierungsimpuls nicht nur im Prozess der selbstorganisierten Weiterentwicklung ihrer Praxisregeln Digitalisierung wirksam werden, sondern auch im Kontext der jüngsten Initiative der DFG zur Normierung der thermographischen Reproduktion von Wasserzeichen.

Das vorgestellte Projekt ist dem auf drei konsekutive Phasen angelegten DFG-Förderprogramm e-Research-Technologien zugeordnet: Daher soll die Implementierung für den Regelbetrieb des in der initialen Förderperiode (Phase 1) zu entwickelnden und erprobenden Softwaretools zur automatischen Wasserzeichenbestimmung erst im Rahmen eines geplanten Anschlussprojekts (Phase 2) erfolgen. Spätestens dann sollten Sie sich also keinen Kopf mehr machen müssen, bei der Identifikation historischer Wasserzeichen wie der Ochs vorm Berg zu stehen.

P.S. Bei Fragen zu diesem Vorhaben und seinen drei Arbeitspaketen wenden Sie sich bitte direkt an die hier genannten Ansprechpersonen.

Projektnummer: 576443479

0 Kommentare

Ihr Kommentar

An Diskussion beteiligen?
Hinterlassen Sie uns einen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.