Interaktive Grammatikanalyse historischer Texte: Adaptive Annotationsverfahren zur Erschlie?ung des Sprachausbaus im Mittelniederdeutschen

Overview

Das empirische Forschungsvorhaben untersucht den Sprachausbau des Mittelniederdeutschen vom 13. Jahrhundert bis zum Schreibsprachenwechsel im 16./17. Jahrhundert, mit dem das Mittelniederdeutsche seine Geltung als Schriftsprache an das Frühneuhochdeutsche verliert. Es leistet damit einen Beitrag zur Rekonstruktion der bislang erst punktuell untersuchten grammatischen Entwicklung des Mittelniederdeutschen als historischer Schriftsprache. Die Untersuchung konzentriert sich auf st?dtische Rechtssatzungen, und zwar aus mehreren Gründen: Sprachliche Ausbauprozesse finden sich mutma?lich gerade in der Rechtsschriftlichkeit, die komplexe Rechtssachverhalte in allen rechtsrelevanten Aspekten kontextentbunden explizieren muss. In Rechtssatzungen geht es dabei in einem alltagspraktischen Sinne stets um konditionale Sachverhaltsrelationen, so dass untersucht werden kann, wie sich die grammatische Konstruktion von Konditionalit?t im Untersuchungszeitraum wandelt. Schlie?lich sind Rechtssatzungen lokalisier- und datierbar, so dass sich die zeitr?umliche Entwicklungsdynamik des Ausbaus nachzeichnen l?sst. Entwickelt wird ein "interaktives" Verfahren, das maschinelles Lernen und Expertenfeedback kombiniert. Auf diese Weise soll ein zentrales Problem bestehender Annotationsverfahren für historische Texte gel?st werden. Existierende Parsing- und Tagging-Verfahren der Computer- bzw. Korpuslinguistik setzen statische (a priori definierte) Grammatiken bzw. grammatische Kategorien voraus, was der historischen Dynamik der Grammatik nicht gerecht wird. Eine sich diachron entwickelnde, dynamische Grammatik mittels regelbasierter Textanalyseverfahren und Methoden des maschinellen Lernens im Korpus zu "entdecken" und auf diese Weise den Sprachwandel evidenzbasiert zu rekonstruieren, ist ein Novum. Da dies gleicherma?en sprach-/grammatikhistorisches Wissen sowie Kenntnisse im Bereich der Computerlinguistik und Informatik voraussetzt, ist das Vorhaben als f?cherübergreifendes Projekt konzipiert, das eine enge Kooperation der F?cher über den gesamten F?rderzeitraum verlangt. Die empirische Basis bildet ein Korpus datier- und lokalisierbarer Rechtsverordnungen und Urteilsaufzeichnungen des 13. bis 17. Jahrhunderts. Es gliedert sich in zwei Subkorpora: Das "Subkorpus Mittelniederdeutsch" bildet das Hauptkorpus und enth?lt origin?r mittelniederdeutsche Texte von 1227 bis ca. 1650 im Umfang von ca. 1,2 Mio. W?rtern. Das "Subkorpus Frühneuhochdeutsch" umfasst eine Auswahl der ersten frühneuhochdeutschen Texte, die als Folge des Schreibsprachenwechsel im niederdeutschen Sprachraum entstehen (400.000 W?rter). ?berprüft werden soll die These, dass diese Texte in grammatischer bzw. syntaktischer Hinsicht noch mittelniederdeutsch bestimmt sind.

Key Facts

Project duration:
01/2017 - 12/2019
Funded by:
DFG
Website:
Homepage

More Information

Principal Investigators

contact-box image

Prof. Dr. Doris Tophinke

Germanistische und Allgemeine Sprachwissenschaft

About the person
contact-box image

Prof. Dr. Michaela Geierhos

Digitale Kulturwissenschaften (bis 2020)

About the person
contact-box image

Prof. Dr. Eyke Hüllermeier

Transregional Collaborative Research Centre 318

About the person

Project Team

contact-box image

Marcel Wever

Intelligent Systems and Machine Learning

About the person
contact-box image

Sascha Henzgen

Publications

Annotation uncertainty in the context of grammatical change
M.-L. Merten, M. Wever, D. Tophinke, M. Geierhos, E. Hüllermeier, International Journal of Corpus Linguistics (2023).
Reliable Part-of-Speech Tagging of Historical Corpora through Set-Valued Prediction
S.H. Heid, M.D. Wever, E. Hüllermeier, Journal of Data Mining and Digital Humanities (n.d.).
UPB-Annotate: Ein ma?geschneidertes Toolkit fu?r historische Texte
N. Seemann, M.-L. Merten, in: P. Sahle (Ed.), DHd 2019 Digital Humanities: multimedial & multimodal. Konferenzabstracts, Zenodo, Frankfurt am Main, Germany, 2019, pp. 352–353.
Interaktive Analyse historischen Grammatikwandels. Konstruktionsgrammatik trifft auf machine learning
M.-L. Merten, D. Tophinke, Jahrbuch für Germanistische Sprachgeschichte 10 (1) (2019) 303–323.
Show all publications