Fachgebiete

Fachgebiet Corpus- und Computerlinguistik, Englische Philologie

Das Fachgebiet Corpus- und Computerlinguistik, Englische Philologie beschäftigt sich mit der Modellierung linguistischer Phänomene auf allen Ebenen der sprachlichen Organisation von Lautung, Lexis, Grammatik bis Semantik und Diskurs in Forschung und Lehre. Im Mittelpunkt des Interesses stehen neben Erkenntnissen über Sprache der Aufbau und die Annotation elektronischer Textcorpora sowie die Entwicklung und Implementierung computerbasierter Methoden und Workflows zur linguistischen Forschung anhand elektronischer Corpora.

Über das Fachgebiet

Fachgebietsleitung: Dr. Sabine Bartsch

Die linguistischen Forschungsinteressen des Fachgebiets Corpus- und Computerlinguistik an der Technischen Universität Darmstadt richten sich auf die corpusbasierte Erforschung funktionaler Variation (Register) von Sprache in unterschiedlichen Kontexten (z.B. Sprache der Wissenschaft, politische Reden etc.). Ein Fokus liegt hier auf der Erstellung von Profilen interagierender Merkmale von Registern sowie auf der historischen Veränderung solcher Register, die sich im Verlauf der Geschichte der modernen Wissenschaften vor allem seit dem späten 17. Jahrhundert entwickelt und ausdifferenziert haben. Ein verwandter Schwerpunkt aus dem Bereich der Registerforschung ist die Analyse wissenschaftlicher Texte als multimodale Artefakte, die neben natürlichsprachlichem Text auch Bilder, Tabellen und Formeln sowie andere nicht-sprachliche Modalitäten umfassen.

Ein weiterer zentraler Forschungsgegenstand sind lexikalische Kookkurrenzphänomene, hier vor allem sogenannte Kollokationen. Diese lassen sich in allen Bereichen der Sprache beobachten und sind von besonderer Relevanz, weil sie eine wichtige Rolle in der semantischen Bedeutungsdifferenzierung spielen („You shall know a word by the company it keeps.“ J.R. Firth). Kollokationen haben darüber hinaus einen hohen Stellenwert in der sprachlichen Produktion und Rezeption von Fremdsprachenlernern sowie bei der Terminologiebildung, da die Kookkurrenz lexikalischer Ausdrücke häufig fachspezifische Bedeutungsdifferenzierungen markiert.

Ein weiteres Forschungsinteresse gilt grammatischen Konstruktionen und umfasst vor allem Verfahren zur Untersuchung seltener Phänomene in Corpora. Beispiele sind Inventare nicht-kanonischer Konstruktionen, wie Spalt-Sätze, NP-Fronting etc. oder Instantiierungen von Modalität und deren Distribution und Funktion im Kontext anderer Konstruktionen innerhalb des Konstruktioneninventars von Einzelsprachen.

Der methodologische Schwerpunkt liegt auf der Erstellung und Annotation elektronischer Corpora, die mit Hilfe manueller und computationeller Verfahren annotiert, nach linguistisch relevanten Mustern durchsucht und mit Blick auf die quantitative Verteilung linguistischer Phänomene charakterisiert, analysiert und statistisch ausgewertet werden. Dabei beruht die Analyse auf Vergleichen der Distribution linguistischer Phänomene. Ein methodologisches Interesse des Fachgebiets gilt weiterhin der Entwicklung von Workflows, die unterschiedliche forschungsspezifische Methoden und Verfahren implementieren und erproben.

Das Fachgebiet Corpus- und Computerlinguistik verantwortet am Institut für Sprach- und Literaturwissenschaft die Methodenausbildung im Bereich der digitalen Philologie (Digital Humanities / Digital Philology). Schwerpunkte des Fachgebiets in der Ausbildung sind:

  • corpus- und computerlinguistische Daten und Methoden
  • Korpusaufbau und -verarbeitung
  • Annotation und Entwicklung von Annotationsverfahren und -workflows
  • quantitative Analysen digitaler Corpora
  • methodologische Synergien zwischen Corpus- und Computerlinguistik und digitaler Literaturwissenschaft sowie anderen Textwissenschaften wie zum Beispiel den Geschichtswissenschaften

Das Fachgebiet speist seine profilierten Themengebiete schwerpunktmäßig in die Ausbildung innerhalb der folgenden Studiengänge ein:

  • Master of Arts Linguistic and Literary Computing
  • (Joint) Bachelor of Arts Digital Philology
  • sowie im Bereich der Anwendungsfächer für BSc- und MSc-Studiengänge

Daneben organisiert das Fachgebiet Workshops und Tutorials zu spezifischen Forschungsfragen.

Das Fachgebiet befasst sich neben der Methodenausbildung auch mit der digitalen Forschungsinfrastruktur in den Digitalen Philologien und den Digital Humanities. Dieser Bereich umfasst die fachliche Beratung zu Fragen der Infrastruktur und der Software für die Verarbeitung sprachlicher Daten und Corpora für die Studierenden sowie die fachwissenschaftliche Anleitung und Beratung in methodischen und technischen Fragen geeigneter digitaler Arbeitsumgebungen für Wissenschaftlerinnen und Wissenschaftler. Hiermit beschäftigt sich unter anderem auch das Projekt linguisticsweb.org