KIT | KIT-Bibliothek | Impressum | Datenschutz

WOKIE - FAIR in allen Sprachen: Ein automatisiertes, LLM-gestütztes Übersetzungssystem für SKOS-Thesauri

Kraus, Felix ORCID iD icon 1; Tonne, Danah ORCID iD icon 1
1 Scientific Computing Center (SCC), Karlsruher Institut für Technologie (KIT)

Abstract:

Thesauri sind zentrale Werkzeuge in den Digital Humanities, um heterogene Forschungsdaten zu strukturieren, auffindbar zu machen und auszuwerten. Eine Veröffentlichung nach den FAIR-Prinzipien wird insbesondere durch Mehrsprachigkeit erheblich verbessert, da sie Nachnutzung und Auffindbarkeit über Sprach- und Ländergrenzen hinweg ermöglicht. Bisher wird dies jedoch nicht durchgängig umgesetzt: Manuelle Übersetzungen sind aufwändig und externe Dienste liefern teils nur ungenaue Fachübersetzungen. Vor diesem Hintergrund stellen wir WOKIE vor, ein Open-Source-Werkzeug zur automatisierten, kontextsensitiven Übersetzung von SKOS (Simple Knowledge Organization System)-Thesauri. WOKIE kombiniert frei wählbare Übersetzungsdienste wie Google Translate, Argos oder PONS mit Large Language Models (LLMs). Durch den Einbezug von Definitionen und Kontextinformationen wird eine hohe Übersetzungsqualität erreicht, was in einer ersten Evaluation gezeigt wurde. Das Werkzeug ist dabei auf handelsüblichen PCs lauffähig. Im Vortrag demonstrieren wir typische Herausforderungen bei der Übersetzung, diskutieren die Bedeutung von Mehrsprachigkeit für die FAIRness von Thesauri und reflektieren Fragen der Urheberschaft bei LLM-generierten Übersetzungen. ... mehr


Verlagsausgabe §
DOI: 10.5445/IR/1000185566
Veröffentlicht am 10.10.2025
Originalveröffentlichung
DOI: 10.5281/zenodo.17178201
Cover der Publikation
Zugehörige Institution(en) am KIT Scientific Computing Center (SCC)
Publikationstyp Proceedingsbeitrag
Publikationsdatum 22.09.2025
Sprache Deutsch
Identifikator KITopen-ID: 1000185566
HGF-Programm 46.21.02 (POF IV, LK 01) Cross-Domain ATMLs and Research Groups
Weitere HGF-Programme 46.21.05 (POF IV, LK 01) HMC
Erschienen in Forschungsdaten in den Geisteswissenschaften: Daten neu denken. Konferenzabstracts (FORGE 2025). Hrsg.: Henny-Krahmer
Veranstaltung Forschungsdaten in den Geisteswissenschaften: Daten neu denken (FORGE 2025), Rostock, Deutschland, 24.09.2025 – 26.09.2025
Verlag Zenodo
Seiten 113-117
Schlagwörter SKOS, Thesauri, LLM, Übersetzung, FORGE2025
Nachgewiesen in OpenAlex
Globale Ziele für nachhaltige Entwicklung Ziel 4 – Hochwertige Bildung
KIT – Die Universität in der Helmholtz-Gemeinschaft
KITopen Landing Page