Die linguistischen Forschungsinteressen des Fachgebiets Corpus- und Computerlinguistik an der Technischen Universität Darmstadt richten sich auf die corpusbasierte Erforschung funktionaler Variation (Register) von Sprache in unterschiedlichen Kontexten (z.B. Sprache der Wissenschaft, politische Reden etc.). Ein Fokus liegt hier auf der Erstellung von Profilen interagierender Merkmale von Registern sowie auf der historischen Veränderung solcher Register, die sich im Verlauf der Geschichte der modernen Wissenschaften vor allem seit dem späten 17. Jahrhundert entwickelt und ausdifferenziert haben. Ein verwandter Schwerpunkt aus dem Bereich der Registerforschung ist die Analyse wissenschaftlicher Texte als multimodale Artefakte, die neben natürlichsprachlichem Text auch Bilder, Tabellen und Formeln sowie andere nicht-sprachliche Modalitäten umfassen.
Ein weiterer zentraler Forschungsgegenstand sind lexikalische Kookkurrenzphänomene, hier vor allem sogenannte Kollokationen. Diese lassen sich in allen Bereichen der Sprache beobachten und sind von besonderer Relevanz, weil sie eine wichtige Rolle in der semantischen Bedeutungsdifferenzierung spielen („You shall know a word by the company it keeps.“ J.R. Firth). Kollokationen haben darüber hinaus einen hohen Stellenwert in der sprachlichen Produktion und Rezeption von Fremdsprachenlernern sowie bei der Terminologiebildung, da die Kookkurrenz lexikalischer Ausdrücke häufig fachspezifische Bedeutungsdifferenzierungen markiert.
Ein weiteres Forschungsinteresse gilt grammatischen Konstruktionen und umfasst vor allem Verfahren zur Untersuchung seltener Phänomene in Corpora. Beispiele sind Inventare nicht-kanonischer Konstruktionen, wie Spalt-Sätze, NP-Fronting etc. oder Instantiierungen von Modalität und deren Distribution und Funktion im Kontext anderer Konstruktionen innerhalb des Konstruktioneninventars von Einzelsprachen.