[Home]
Hans Gert Graebe / Seminar Wissen /
2016-05-24


Home
Neues
TestSeite
DorfTratsch

Suchen
Teilnehmer
Projekte

GartenPlan
DorfWiki
Bildung+Begegnung
DorfErneuerung
Dörfer
NeueArbeit
VideoBridge
VillageInnovationTalk


AlleOrdner
AlleSeiten
Hilfe

Einstellungen

SeiteÄndern







Ein Beispielprojekt aus dem Deutschen Textarchiv

Termin: 24. Mai 2016, 15.15 Uhr

Ort: Seminargebäude, SG 3-10

Thema: Ein Beispielprojekt aus dem Deutschen Textarchiv.

Vortrag und Diskussion mit Daniel Kaack und Eike Martin Mücksch.

Ankündigung

Wir werden zunächst die Arbeit des Deutschen Textarchivs zusammenfassend beschreiben. Anschließend werden wir die Techniken auf dem Weg vom Faksimile zum annotierten Digitalisat anhand eines Beispiels demonstrieren.

Links:

  • http://www.deutschestextarchiv.de/
  • http://www.deutschestextarchiv.de/doku/software
  • Alexander Geyken, Susanne Haaf u.a. (2011): Das Deutsche Textarchiv: Vom historischen Korpus zum aktiven Archiv. In: Digitale Wissenschaft. Stand und Entwicklung digital vernetzter Forschung in Deutschland, 20./21. September 2010. Beiträge der Tagung. Hrsg. von Silke Schomburg, Claus Leggewie, Henning Lobin und Cornelius Puschmann. 2., ergänzte Fassung. hbz, 2011, S. 157–161. ( pdf)
Daniel Kaack, Eike Mücksch, 18.5.2016

Anmerkungen

Im Text (Gayken u.a. 2011) ist der Hintergrund der Entstehung des Deutschen Textarchivs genauer beschrieben. Es ordnet sich ein in die vielfältigen Bemühungen, eine digitale Grundlage für spezielle Forschungsfragen im Bereich der Linguistik zu schaffen und daraus größere Projekte mit eingeschränkterem Fokus wie die Deutsche Digitale Bibliothek zu unterstützen.

Im Deutschen Textarchiv wurde mit DFG-Unterstützung über acht Jahre lang ein Bestand von über 1.300 historischen deutschen Textkorpora von ca. 1650 bis 1900 aufgearbeitet und einer detaillierten computergestützten Sprachanalyse zugänglich gemacht. Aus dem spezifischen Forschungsfokus ergibt sich die spezifische Aufbereitungstiefe des Materials selbst - es wurde ein großer personeller Aufwand getrieben für die genaue Wiedergabe historisch klar einzuordnender Quellen sowie eine davon getrennte Lemmatisierung und Normalisierung der Texte, so dass sich sowohl Fragen der sprachlichen Entwicklung als auch inhaltliche Fragen studieren lassen. Die Tokenisierung der Texte auf Wortebene ist mit der strukturellen Aufbereitung der Digitalisate verknüpft, so dass auch die Möglichkeit besteht, nicht aufgenommene Merkmale aus den Bildquellen nachzurecherchieren, wie im zweiten Teil des Vortrags genauer gezeigt wurde.

Die Kodierung der Informationen verwendet die XML-Standards der Text Encoding Initiative TEI, wobei mit dem DTA-Basisformat eine Teilmenge des sehr umfangreichen Standards definiert wurde, die heute auch in vielen anderen Projekte verwendet wird. Die genaue Struktur des Auszeichnungsformats wurde im Vortrag an einem Beispiel demonstriert. Die enge konzeptionelle Verbindung zu RDF-Auszeichnungstechniken wäre eine genauere Besprechung wert.

In der Diskussion standen zwei Fragen im Mittelpunkt:

  1. die Nachhaltigkeit der Verfügbarkeit dieser Quellen und
  2. die Frage des Einflusses solcher Digitalisierungsprozesse und Digitalisate auf die Forschungsfragen und -methodiken selbst.
Zu (1): Die durch DFG-Projektgelder intensiv unterstützte Initialphase ist inzwischen beendet, die (inhärent wenig akademische) Frage der Organisation von Verfügbarkeit, Bewirtschaftung und Ausbau der Sammlung und damit der Sicherung einer Forschungsinfrastruktur ist zu lösen. Solche Fragen, wie sie die experimentellen Naturwissenschaften mit Großgeräteinvestitionen seit langem kennen und entsprechende Finanzierungsmöglichkeiten für derartige Infrastrukturen aufgebaut sind, kennt man allerdings auch in den Geisteswissenschaften, denn die dort genauer untersuchten Artefakte gehören oft zum historisch-kulturellen Erbe und sind nicht nur aus akademischer Warte wichtig. Die weitere Grundfinanzierung des Deutschen Textarchivs liegt in den Händen der BBAW, der Berlin-Brandenburgischen Akademie der Wissenschaften, und wird dort vermutlich weitgehend als Bibliotheksaufgabe einer auskömmlich finanzierten Mehrländeranstalt gesehen, deren Finanzen auch für die Sicherung und den Erhalt des kulturellen Erbes einzusetzen sind. Eine neue Form von Kulturerbe stellt das Deutsche Textarchiv auf jeden Fall dar. Eine enge Verflechtung besteht mit anderen einschlägigen Einrichtungen wie der Europeana oder der Deutschen Digitalen Bibliothek, die als entsprechende bibliothekarische Leiteinrichtungen auf europäischer bzw. bundesdeutscher Ebene die Zugänglichkeit zu Digitalisaten unserer Kulturgüter koordinieren, sowie der Open Archive Initiative, die mit ihrem Protocol for Metadata Harvesting entsprechende Metainformationen vernetzt und zugänglich macht. Bei all diesen Fragen spielen Standardisierungen von Protokollen und damit die Bindung aus konkreten Praxen erwachsender semantischer Kommunikationsbedarfe an syntaktische Standards zur Herstellung von Interoperabilität (und damit neue Fiktionen gesellschaftlicher Normalität - siehe die Vorlesung) eine zentrale Rolle.

Zu (2): Hier stand die Frage im Raum, welche normative Wirkung derartige "objektivierte" Datenbestände auf Forschungsfragen und -methodiken haben. Setzen sich hiermit auch in Teilen der Geisteswissenschaften Methodiken durch, in deren Mittelpunkt die Aussonderung von Hypothesen durch die Falsifizierung im Experiment steht, wie sich dies in den Naturwissenschaften weitgehend durchgesetzt hat? Und stimmt das letztere Bild überhaupt oder ist ein solcher Wissenschaftspositivismus ein eher allgemein transportiertes Bild der Naturwissenschaften, das in konkreten Forschungspraxen nur die halbe Wahrheit ist? Die Sprechweise von "gesichertem Wissen" intendiert eine Differenz und weist auf den historisch-formativen Charakter auch der Naturwissenschaften hin. Ist zu erwarten, dass eine stärker selbstreflexive Tradition der Geisteswissenschaften hilft, manchen Kurzschluss der Naturwissenschaften zu vermeiden? Die erfolgreiche Einwerbung von Mitteln für ein großes Digitalisierungsprojekt durch eine spezielle Schule festigt jedenfalls deren Stellung in der Wissenschaftslandschaft und hat damit prägende Wirkung auf diese Forschungslandschaft selbst. Darin unterscheiden sich Digitalisierungsprojekte allerdings nur wenig von anderen akademischen Aktivitäten und die Naturwissenschaften nur wenig von den Geisteswissenschaften.

Hans-Gert Gräbe, 26.5.2016


OrdnerVeranstaltungen