Nadel(n) im Heuhaufen harvesten

Ein Beitrag von Maria Federbusch.

Wer mit Daten aus unseren Digitalisierten Sammlungen arbeitet, kennt sicherlich bereits unsere OAI-Schnittstelle. Sie folgt dem OAI-PMH 2.0-Protokoll der Open Archives Initiative. Über diese Schnittstelle können Datensets geharvestet werden. Bisher dominierten die einerseits nach Sachgruppen des Alten Realkatalogs und andererseits nach Formalkategorien „ordnenden“ Sets diese Schnittstelle. Vornehmlich datentechnische Informationen zur Nutzung unserer Schnittstelle findet man seit Sommer 2019 dazu in unserem SBB-Lab. Nun erreichen uns immer wieder Anfragen, die auf andere Schnittmengen unserer Daten abzielen. Zudem „verstecken“ sich in den größer werdenden Sets interessante durch Projekte entstandene Spezialkorpora, deren Attribute hinsichtlich der zugrundeliegenden Originale bzw. ihrer Erschließung oder Digitalisierung hervorgehoben werden sollen. Daher haben wir in einem ersten Schritt begonnen, derartige spezielle Datensets für Druckschriften zusätzlich zu den bisher über die Schnittstelle verfügbaren anzubieten. Jetzt kann auch nach Jahrhunderten, Projekten oder einigen beispielhaften Gattungen ausgewählt werden.

 

Beispiele für spezielle Sets

 

Ohne Hintergrundinformationen wüsste allerdings weiterhin niemand, worin evtl. Besonderheiten liegen können. Sie finden ab sofort zu jedem dieser Sets im SBB-Lab eine kurze Beschreibung unter Berücksichtigung folgender Aspekte:
Material (Sprache, Erscheinungszusammenhänge, Bezüge zu o.g. sachlichen OAI-Sets), Umfang (Zahl der METS-Dateien zum jetzigen Zeitpunkt; Publikationsarten der Originale; Digitalisierungsgrad innerhalb des einschlägigen SBB-Bestands), nach Möglichkeit Verlinkung zu den zugehörigen Katalogisaten im StaBiKat, Spezifika aller Art (vorhandene Volltexte und Strukturdaten; zusätzliche Sacherschließung; Besonderheiten der Digitalisierung), Verlinkung zu vorhandenen Projektseiten, Lizenzen und Ansprechpartner.

Beispiele für Beschreibungen im SBB-Lab

 

Die Überschrift benennt das Set und bildet zugleich die Verlinkung zur OAI-Schnittstelle. Nun können wir bei unserer (niemals vollständigen) Setbildung nicht immer Angaben zu allen Aspekten liefern; auch ist das eine oder andere Set im Moment eher experimentell zu verstehen. Schauen Sie selbst.
Wie eingangs beschrieben, möchten wir auch die Schnittstelle „selbstredender“ gestalten. Daher finden Sie an prominenter Stelle den Verweis auf das SBB-Lab sowie bei jedem Set eine konkrete Verlinkung zur jeweiligen Beschreibung. Die Benutzung der Schnittstelle wird des Weiteren erleichtert – oder sagen wir menschenlesbarer – durch die Verlinkung zur SBB-Präsentation sowie zum DFG-Viewer auf Datensatzebene.

Screenshot Beispiel Datensatz

Vielleicht haben wir jetzt Wünsche geweckt oder Projektideen bei Ihnen gesät – es würde uns freuen. Wir sind daran, auch für unsere zahlreichen Sondermaterialien weitere Sets inklusive Bestandsbeschreibungen zu erstellen. Gern hören wir auch von der Verwendung unserer Daten in Ihren Vorhaben, v.a. hinsichtlich der Digital Humanities. Hier gilt es, noch viele Nadeln zu finden!

3 Kommentare
  1. Avatar
    David Zellhöfer sagte:

    Liebe Frau Federbusch,
    dann wäre das Glück ja perfekt, wenn man auch alle Werke selektieren könnte, die durch die OCR gingen. Das würde sehr weiterhelfen!

    Antworten

Ihr Kommentar

An Diskussion beteiligen?
Hinterlassen Sie uns einen Kommentar!

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.