Jahrspalterei – unsere digitalisierten Jahresberichte deutscher Handelskammern in einem Benchmarking-Datenset historischer Tabellen (1750–1990)
Nach wie vor stellen maschinelle Erkennung und Extraktion der Inhalte historischer Tabellen die verfügbaren proprietären wie quelloffenen Softwareangebote für Optical Character / Handwritten Text Recognition (OCR/HTR) vor beträchtliche Herausforderungen – selbst bei gedruckten Vorlagen und ungeachtet der rasanten Dynamik auf diesem Informatikfeld. Den Wunsch der Forschenden nach niedrigschwelligen und idealerweise webbasierten Angeboten zur automatischen Tabellenextraktion […]