Entwicklung einer Meta-Methodik und eines konzeptuellen Rahmens zur transdisziplinären Tiefenerschließung und Analyse multimodaler digitaler Objekte. Demonstriert an den Use Cases KI- und Klimawandel-Diskurse
Projektförderung: BMBF-Verbundprojekt im Rahmen der Richtlinie zur Förderung von Forschungs- und Entwicklungsvorhaben zur theoretischen, methodischen und technischen Weiterentwicklung der digitalen Geisteswissenschaften, Bundesanzeiger vom 22.07.2019
Projektlaufzeit: 2021 – 2024
Projektpartner: Sabine Bartsch (Institut für Sprach- und Literaturwissenschaft, TU Darmstadt) | Tobias Hecking (Institut für Softwaretechnologie, DLR) | Wolfgang Stille (hessian.ai)
Projektmitarbeitende:
Debajyoti Paul Chowdhury
Changxu Duan
Sherry Tan
Elena Volkanovska
Ziel des Gesamtprojekts ist die Entwicklung und Erprobung eines Konzepts zur Tiefenerschließung multimodaler Datenbestände. Grundlage ist die Vernetzung unterschiedlicher Typen von digitalen Objekten, so dass eine echte Generierung von Wissen auf Basis digitaler Sammlungen möglich wird. Es basiert auf aktuellen geisteswissenschaftlichen und informationstechnologischen Theorien und Methoden mit dem Ziel einer transdisziplinären Erweiterung und Teilung von Wissen, die bislang durch mangelnde Vernetzung der Bestände und das Fehlen von Möglichkeiten der Anreicherung durch Annotation und Kommentierung verhindert wird. Zur Erprobung der entwickelten Konzepte werden transdisziplinäre multimodale Korpora (TMK) zu den exemplarischen Use Cases – Diskurse zum Klimawandel und Künstlicher Intelligenz – aufgebaut, manuell und automatisch annotiert, vernetzt und analysiert sowie in Expertinnenworkshops diskutiert und bewertet.
Ziel der Analyse und Bereitstellung vernetzter multimodaler Korpora ist die Entwicklung und Erprobung korpus- und computerlinguistischer Verfahren zu Aufbau, Annotation und Analyse multimodaler Korpora. Dabei wird zwischen den Partnern ein auf zwei Themenbereiche fokussiertes Korpus so aufbereitet, dass durch eine Kombination automatischer und manueller Annotationsverfahren und darauf aufbauenden Analysen eines Korpus aus zwei Beispieldomänen – Klimawandel und Künstliche Intelligenz – Merkmale identifiziert werden können, die sich als Grundlage für die semantische Vernetzung textueller und intertextueller linguistischer und multimodal kodierter Konzepte eignen und so die Zugriffsmöglichkeiten auf Text- und Datenkorpora erweitern. Die entwickelten Korpusdaten und Analyseszenarien werden in Expertenworkshops sowie in Workshops für Wissenschaftler*innen und die interessierte Öffentlichkeit erprobt und iterativ verbessert.