5 Mio. Begriffe aus dem DDR-Presseportal der SBB für die Digital Humanities
Im Rahmen eines DFG-Projekts wurden an der SBB die drei DDR-Tageszeitungen „Neues Deutschland“, „Berliner Zeitung“ und „ Neue Zeit“ von 1945/46 bis 1990/94, also für einen Erscheinungszeitraum von fast 50 Jahren, digitalisiert. Seit Juni 2013 können im Portal „DDR-Presse“ ca. 4 Millionen Artikel nach Anmeldung weltweit und kostenfrei recherchiert werden.
Die Textkorpora dieser Tageszeitungen werden jetzt in einem weiteren Projekt als Datenbasis für computerlinguistische Untersuchungen genutzt. Kooperationspartner sind die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW), das Institut für Geschichtswissenschaften – Bereich Historische Fachinformatik der Humboldt-Universität zu Berlin und das Zentrum für Zeithistorische Forschung in Potsdam (ZZF). Das an der BBAW angesiedelte CLARIN-D-Zentrum wird die Zeitungsdaten als CLARIN-Ressource aufwerten und in die entsprechende Infrastruktur integrieren. CLARIN-D (Common Language Resources and Technology Infrastructure in Deutschland) ist die deutsche Sektion des europaweiten CLARIN-Netzwerks, dessen Ziel der Aufbau einer nachhaltigen webbasierten Forschungsinfrastruktur insbesondere für die Geistes- und Sozialwissenschaften ist.
Die drei Zeitungen werden als erste Zeitungskorpora der DDR und als erste deutsche Tageszeitungen für den Zeitraum 1945 – 1994 überhaupt in die Korpora des Digitalen Wörterbuchs der deutschen Sprache (DWDS) eingehen. Mit dem computerlinguistischen Tool von CLARIN-D werden Analysen zur Charakteristik des Sprachgebrauchs und zum Sprachwandel in der DDR-Presse durchgeführt, so z.B. zum Wertewandel in der Sprache und zu Sprache als Kampfmittel. Ziel des neuen Projektes ist es, dieses Tool in seiner Anwendung auf zeitgeschichtliche Korpora zu evaluieren.
Ihr Kommentar
An Diskussion beteiligen?Hinterlassen Sie uns einen Kommentar!