Humboldt-Universität zu Berlin - Sprach- und literaturwissenschaftliche Fakultät - Institut für Klassische Philologie, HU Berlin

Projekt Abstrakt

Titel:

Daidalos-Projekt - Entwicklung einer Infrastruktur zum Einsatz von Natural Language Processing (NLP) für Forschende der Klassischen Philologie 

 

Zusammenfassung:

Das Daidalos-Projekt zielt auf die Entwicklung einer Infrastruktur, mit deren Hilfe lateinische und griechische Texte von den Forschenden selbst mit Methoden des Natural Language Processing, z. B. Part-of-Speech-Tagging, Named Entity Recognition, Sentimentanalyse, Topic Modelling, analysiert werden können. Dazu werden diese Methoden so den Forschenden zur Verfügung gestellt, dass sie diese auf einem individuell zusammengestellten Forschungskorpus anwenden können. Damit fokussiert das Daidalos-Projekt auf die Bereitstellung einer leicht zugänglichen Plattform vielfältiger digitaler Forschungsmethoden, die sowohl sprachgeschichtliche, z. B. die Kontextualisierung eines Wortes über Zeit, als auch literaturwissenschaftliche Forschungsvorhaben, z. B. die Analyse autorspezifischer Diskursstrukturen, unterstützt. Um eine möglichst große Bandbreite digitaler Forschungsmethoden unterstützen zu können, werden sprachspezifische Lösungen nachgenutzt und vorhandene Lösungen aus den modernen Sprachen adaptiert.

In Workshops und durch die Aufbereitung von methodenspezifischen Lernbausteinen werden Forschende, Lehrende und Studierende der Klassischen Philologie in die Arbeit mit NLP im Allgemeinen und mit der zu entwickelnden Software im Speziellen eingeführt, um auf der Basis der datenbasierten Analysen neue Perspektiven auf innovative oder bereits existierende Forschungsfragen der Klassischen Philologie zu ermöglichen. Durch die Integration dieser Zielgruppe unterstützen v. a. die geplanten Workshops neben dem fachlichen Kompetenzausbau (Digital Literacy) die überregionale Dissemination und nachhaltige Akzeptanz der Infrastruktur. 

Schlagwörter:

Latein, (Alt-)Griechisch, Digital Literacy, NLP, computerlinguistische Textanalysen, Digital Humanities, Forschungsinfrastruktur

 

PIs: Dr. Andrea Beyer (Institut für Klassische Philologie), Prof. Dr. Anke Lüdeling (Institut für deutsche Sprache und Linguistik), Malte Dreyer (Computer- und Medienservice)

Projektmitarbeiter: Konstantin Schulz (Linguistik, NLP)

Mittelgeber: DFG

Förderbereich: Wissenschaftliche Literaturversorgungs- und Informationssysteme (LIS)

Programm: e-Research-Technologien

Projektnummer: 518919950

Dauer: 3 Jahre

Umfang: 3 Stellen, jeweils E13 zu 100%

Projektstart: voraussichtlich im Juli 2023

 

Forschungsbeispiele aus dem Antrag (zur Veranschaulichung der Projektidee)

Beispiel 1:

Mit welchen Attributen ist bellum verknüpft? Ist die Kollokation bellum iustum als Konzept nachweisbar (vgl. Girardet, Klaus M. (2007): Gerechter Krieg - Von Ciceros Konzept des Bellum Iustum bis zur UNO-Charta).

Mit Daidalos könnte man alle Belege auf ihre Assoziationsstärke untersuchen, also die Wahrscheinlichkeit, feste Kollokationen im Vergleich zu sonstigen Kontexten von bellum und iustus zu sein (Abb. 1). 

Auszug Kollokationenanalyse bellum als ungewichteter GraphAuszug aus einer Kollokationenanalyse zu iustus als ungerichteter Graph

 

Beispiel 2:

Wie wird mit Faktualität (Gegensatzpaar: fabula - probata, "bloße Erzählung - überprüfte Fakten") in verschiedenen Gattungen umgegangen (vgl. Cordes, Lisa (2020): Wenn Fiktionen Fakten schaffen. Faktuales und fiktionales Erzählen in den spätantiken Panegyrici Latini, in: Breitenwischer, Dustin; Häger, Hanna-Myriam; Menninger, Julian: Faktuales und fiktionales Erzählen II. Geschichte - Medien - Praktiken, 31-56)?

Daidalos könnte die semantische Suche und damit das Auffinden relevanter und oftmals unerwarteter Textstellen unterstützen, indem die Software mittels distributioneller Semantik die Suche nach Wortfeldern, Themen oder ähnlichen Diskursstrukturen ermöglicht (Abb. 2).

uera.png