Beiträge

Save the Date: 3. Workshop Retrodigitalisierung „OCR – Prozesse und Entwicklungen“ am 1. März 2021

Save-the-Date: Am 01. März 2021 findet der 3. Workshop Retrodigitalisierung unter dem Titel „OCR – Prozesse und Entwicklungen“ als virtueller Workshop über Zoom statt, zu dem wir Sie herzlich einladen.  Veranstalter sind die drei Zentralen Fachbibliotheken (ZB MED, TIB und ZBW) sowie die Staatsbibliothek zu Berlin – Preußischer Kulturbesitz. Die Digitalisierung bietet neue Zugangsformen zu […]

Kuratieren mit KI: Erste Ergebnisse aus dem QURATOR-Projekt

Ein Beitrag aus unserer Reihe Künstliche Intelligenz zum Wissenschaftsjahr 2019 QURATOR ist ein BMBF-gefördertes Forschungsprojekt mit dem Ziel, ein weites Spektrum von Kuratierungstechnologien basierend auf Methoden und Verfahren der künstlichen Intelligenz zu entwickeln. Wir haben hier im Blog schon mehrfach zum Projekt berichtet. Nachdem im November 2019 das erste von insgesamt drei Jahren Projektlaufzeit endete, liegen inzwischen auch Zwischenergebnisse […]

Bild1

Mit KI zum Durchbruch bei der OCR für historische Drucke

Ein Beitrag aus unserer Reihe Künstliche Intelligenz zum Wissenschaftsjahr 2019 Texterkennung bzw. OCR (Optical Character Recognition) stellt einen entscheidenden Schritt dar, um von Digitalisaten, d.h. gescannten Bildern von (Buch-)Seiten, zu durchsuchbarem, elektronischen Volltext zu gelangen. Während OCR für zeitgenössische Dokumente inzwischen beinahe fehlerfrei funktioniert, sahen die mit kommerziellen OCR-Produkten erzielbaren Ergebnisse bei historischen Drucken und Frakturschriften bislang weniger zufriedenstellend […]

ALTO XML Schema

SBB engagiert sich im ALTO Board

Seit dem 14. November 2015 ist die Staatsbibliothek zu Berlin im Editorial Board des internationalen ALTO Standards vertreten. Nun werden Sie sich fragen: was ist denn ALTO überhaupt und warum sollte mich das interessieren? Was bzw. wofür ist ALTO? ALTO steht für Analyzed Layout and Text Object, ein XML Schema zur Beschreibung von Layout- und […]

Digitalisierte Sammlungen werden agil: neues Portal und Labor starten in Betaphase

tl;dr: Unsere Digitalisierten Sammlungen wurden umfangreich überarbeitet. In dem neuen Beta-Portal sieht für die NutzerInnen aber fast alles aus wie vorher. Dafür gibt es einen guten Grund. Die Digitalisierten Sammlungen der Staatsbibliothek gehören zu unseren nachgefragtesten digitalen Diensten. Allein im Monat März verzeichneten wir 30.000 BesucherInnen und über 1/3 Millionen Seitenansichten. Über 100.000 Werke stehen […]