Corpus- und Computerlinguistik, Englische Philologie


Fachgebietsleitung: Opens internal link in current windowDr. Sabine Bartsch

Das Fachgebiet Corpus- und Computerlinguistik, Englische Philologie beschäftigt sich mit der Modellierung linguistischer Phänomene auf allen Ebenen der sprachlichen Organisation von Lautung, Lexis, Grammatik bis Semantik und Diskurs in Forschung und Lehre. Im Mittelpunkt des Interesses stehen neben Erkenntnissen über Sprache der Aufbau und die Annotation elektronischer Textcorpora sowie die Entwicklung und Implementierung computerbasierter Methoden und Workflows zur linguistischen Forschung anhand elektronischer Corpora.

Die linguistischen Forschungsinteressen des Fachgebiets Corpus- und Computerlinguistik an der Technischen Universität Darmstadt richten sich auf die corpusbasierte Erforschung funktionaler Variation (Register) von Sprache in unterschiedlichen Kontexten (z.B. Sprache der Wissenschaft, politische Reden etc.). Ein Fokus liegt hier auf der Erstellung von Profilen interagierender Merkmale von Registern sowie auf der historischen Veränderung solcher Register, die sich im Verlauf der Geschichte der modernen Wissenschaften vor allem seit dem späten 17. Jahrhundert entwickelt und ausdifferenziert haben. Ein verwandter Schwerpunkt aus dem Bereich der Registerforschung ist die Analyse wissenschaftlicher Texte als multimodale Artefakte, die neben natürlichsprachlichem Text auch Bilder, Tabellen und Formeln sowie andere nicht-sprachliche Modalitäten umfassen.

Ein weiterer zentraler Forschungsgegenstand sind lexikalische Kookkurrenzphänomene, hier vor allem sogenannte Kollokationen. Diese lassen sich in allen Bereichen der Sprache beobachten und sind von besonderer Relevanz, weil sie eine wichtige Rolle in der semantischen Bedeutungsdifferenzierung spielen ("You shall know a word by the company it keeps." J.R. Firth). Kollokationen haben darüber hinaus einen hohen Stellenwert in der sprachlichen Produktion und Rezeption von Fremdsprachenlernern sowie bei der Terminologiebildung, da die Kookkurrenz lexikalischer Ausdrücke häufig fachspezifische Bedeutungsdifferenzierungen markiert.
Ein weiteres Forschungsinteresse gilt grammatischen Konstruktionen und umfasst vor allem Verfahren zur Untersuchung seltener Phänomene in Corpora. Beispiele sind Inventare nicht-kanonischer Konstruktionen, wie Spalt-Sätze, NP-Fronting etc. oder Instantiierungen von Modalität und deren Distribution und Funktion im Kontext anderer Konstruktionen innerhalb des Konstruktioneninventars von Einzelsprachen.

Methodologischer Schwerpunkt


Der methodologische Schwerpunkt liegt auf der Erstellung und Annotation elektronischer Corpora, die mit Hilfe manueller und computationeller Verfahren annotiert, nach linguistisch relevanten Mustern durchsucht und mit Blick auf die quantitative Verteilung linguistischer Phänomene charakterisiert, analysiert und statistisch ausgewertet werden. Dabei beruht die Analyse auf Vergleichen der Distribution linguistischer Phänomene. Ein methodologisches Interesse des Fachgebiets gilt weiterhin der Entwicklung von Workflows, die unterschiedliche forschungsspezifische Methoden und Verfahren implementieren und erproben.

Methodenausbildung


Das Fachgebiet Corpus- und Computerlinguistik verantwortet am Institut für Sprach- und Literaturwissenschaft die Methodenausbildung im Bereich der digitalen Philologie (Digital Humanities / Digital Philology). Schwerpunkte des Fachgebiets in der Ausbildung sind:
-    corpus- und computerlinguistische Daten und Methoden
-    Annotation und Entwicklung von Annotationsverfahren und -workflows
-    quantitative Analysen digitaler Corpora
-    methodologische Synergien zwischen Corpus- und Computerlinguistik und digitaler Literaturwissenschaft

Studiengänge


Das Fachgebiet speist seine profilierten Themengebiete schwerpunktmäßig in die Ausbildung in den folgenden Studiengängen ein:
-    Master of Arts Linguistic and Literary Computing
-    (Joint) Bachelor of Arts Digital Philology
-    sowie im Bereich der Anwendungsfächer für Studiengänge in Informatik und Mathematik

Digitale Forschungsinfrastruktur


Das Fachgebiet zeichnet neben der Methodenausbildung auch für die digitale Forschungsinfrastruktur des Instituts für Sprach- und Literaturwissenschaft verantwortlich. Dieser Bereich umfasst die fachliche Betreuung der Infrastruktur und der Software für die Verarbeitung sprachlicher Daten und Corpora sowie die fachlichwissenschaftliche Betreuung der Arbeitsumgebungen von Wissenschaftlerinnen und Wissenschaftler des Instituts und die Anleitung und Beratung der Fachgebiete in methodischen und technischen Fragen.

Kontakt


Institut für Sprach- und Literaturwissenschaft

 

Besucheradresse:
Landwehrstraße 50A
Gebäude S4|23
64293 Darmstadt

 

Postanschrift:
Dolivostraße 15 
64293 Darmstadt

Team


Sabine Bartsch
Sebastian Gombert
Caroline Iliadi
Milena Schwindt

Ehemalige Teammitglieder


Anna Meisinger
Denis Cédric Pierpaoli
Lisa Scharrer

A A A | Drucken Drucken | Impressum | Sitemap | Suche | Webmail | TU
zum Seitenanfangzum Seitenanfang