Forschung am Fachgebiet Corpus- und Computerlinguistik, Englische Philologie

Entwicklung einer Meta-Methodik und eines konzeptuellen Rahmens zur transdisziplinären Tiefenerschließung und Analyse multimodaler digitaler Objekte. Demonstriert an den Use Cases KI- und Klimawandel-Diskurse

Projektförderung: BMBF-Verbundprojekt im Rahmen der Richtlinie zur Förderung von Forschungs- und Entwicklungsvorhaben zur theoretischen, methodischen und technischen Weiterentwicklung der digitalen Geisteswissenschaften, Bundesanzeiger vom 22.07.2019

Projektlaufzeit: 2021 – 2024

Projektpartner: Sabine Bartsch (Institut für Sprach- und Literaturwissenschaft, TU Darmstadt) | Tobias Hecking (Institut für Softwaretechnologie, DLR) | Wolfgang Stille (hessian.ai)

Projektmitarbeitende:

Debajyoti Paul Chowdhury

Changxu Duan

Sherry Tan

Elena Volkanovska

Ziel des Gesamtprojekts ist die Entwicklung und Erprobung eines Konzepts zur Tiefenerschließung multimodaler Datenbestände. Grundlage ist die Vernetzung unterschiedlicher Typen von digitalen Objekten, so dass eine echte Generierung von Wissen auf Basis digitaler Sammlungen möglich wird. Es basiert auf aktuellen geisteswissenschaftlichen und informationstechnologischen Theorien und Methoden mit dem Ziel einer transdisziplinären Erweiterung und Teilung von Wissen, die bislang durch mangelnde Vernetzung der Bestände und das Fehlen von Möglichkeiten der Anreicherung durch Annotation und Kommentierung verhindert wird. Zur Erprobung der entwickelten Konzepte werden transdisziplinäre multimodale Korpora (TMK) zu den exemplarischen Use Cases – Diskurse zum Klimawandel und Künstlicher Intelligenz – aufgebaut, manuell und automatisch annotiert, vernetzt und analysiert sowie in Expertinnenworkshops diskutiert und bewertet.

Ziel der Analyse und Bereitstellung vernetzter multimodaler Korpora ist die Entwicklung und Erprobung korpus- und computerlinguistischer Verfahren zu Aufbau, Annotation und Analyse multimodaler Korpora. Dabei wird zwischen den Partnern ein auf zwei Themenbereiche fokussiertes Korpus so aufbereitet, dass durch eine Kombination automatischer und manueller Annotationsverfahren und darauf aufbauenden Analysen eines Korpus aus zwei Beispieldomänen – Klimawandel und Künstliche Intelligenz – Merkmale identifiziert werden können, die sich als Grundlage für die semantische Vernetzung textueller und intertextueller linguistischer und multimodal kodierter Konzepte eignen und so die Zugriffsmöglichkeiten auf Text- und Datenkorpora erweitern. Die entwickelten Korpusdaten und Analyseszenarien werden in Expertenworkshops sowie in Workshops für Wissenschaftler*innen und die interessierte Öffentlichkeit erprobt und iterativ verbessert.

zur Projektwebsite: insightsnet.org

Forschungsprojekte

Forschungsprojekte am Fachgebiet Corpus- und Computerlinguistik, Englische Philologie

Datenkompetenz von Anfang an

Digital Literacy Lab | Kompetenznetzwerk Digitalität in der Lehre

BMBF-Verbundprojekt InsightsNet

programming4humanities

linguisticsweb.org

EmpiriST 2015: GSCL Shared Task: Automatische sprachliche Annotation computergestützter Kommunikation / Social Media

LOEWE-Schwerpunkt Digital Humanities

PACE Ling