5 Mio. Begriffe aus dem DDR-Presseportal der SBB für die Digital Humanities

Im Rahmen eines DFG-Projekts wurden an der SBB die drei DDR-Tageszeitungen „Neues Deutschland“, „Berliner Zeitung“ und „ Neue Zeit“ von 1945/46 bis 1990/94, also für einen Erscheinungszeitraum von fast 50 Jahren, digitalisiert. Seit Juni 2013 können im Portal „DDR-Presse“ ca. 4 Millionen Artikel nach Anmeldung weltweit und kostenfrei recherchiert werden.

Die Textkorpora dieser Tageszeitungen werden jetzt in einem weiteren Projekt als Datenbasis für computerlinguistische Untersuchungen genutzt. Kooperationspartner sind die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW), das Institut für Geschichtswissenschaften – Bereich Historische Fachinformatik der Humboldt-Universität zu Berlin und das Zentrum für Zeithistorische Forschung in Potsdam (ZZF). Das an der BBAW angesiedelte CLARIN-D-Zentrum wird die Zeitungsdaten als CLARIN-Ressource aufwerten und in die entsprechende Infrastruktur integrieren. CLARIN-D (Common Language Resources and Technology Infrastructure in Deutschland)  ist die deutsche Sektion des europaweiten CLARIN-Netzwerks, dessen Ziel der Aufbau einer nachhaltigen webbasierten Forschungsinfrastruktur insbesondere für die Geistes- und Sozialwissenschaften ist.

Die drei Zeitungen werden als erste Zeitungskorpora der DDR und als erste deutsche Tageszeitungen für den Zeitraum 1945 – 1994 überhaupt in die Korpora des Digitalen Wörterbuchs der deutschen Sprache (DWDS) eingehen. Mit dem computerlinguistischen Tool von CLARIN-D werden Analysen zur Charakteristik des Sprachgebrauchs und zum Sprachwandel in der DDR-Presse durchgeführt, so z.B. zum Wertewandel in der Sprache und zu Sprache als Kampfmittel. Ziel des neuen Projektes ist es, dieses Tool in seiner Anwendung auf zeitgeschichtliche Korpora zu evaluieren.

 

 

 

 

0 Kommentare

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.