KIT | KIT-Bibliothek | Impressum | Datenschutz

Analyse und Korrektur von Disfluenzen in gesprochener Sprache

Hochweiß, Robert

Abstract:

Disfluenzen sind ein wesentlicher Bestandteil von spontan gesprochenen Äußerungen. Bei Disfluenzen handelt es sich um Unterbrechungen des normalen Sprechflusses, die durch Fehler, Wortwiederholungen, Füllwörter oder ähnliche andere Wörter entstanden sind. Sie erschweren die Bearbeitung einer Äußerung und müssen daher korrigiert werden. Eine automatisierte Korrektur dieser Disfluenzen erweist sich jedoch aufgrund des unregelmäßigen Aufbaus solcher Disfluenzen als schwierig. Deshalb wird in dieser Arbeit die Erkennung und Korrektur von Disfluenzen in natürlichsprachlichen Äußerungen erarbeitet. Hierzu wird mit Hilfe eines maschinellen Lernverfahrens ein Klassifikator entwickelt, der diese Disfluenzen erkennt und korrigiert. Das maschinelle Lernverfahren basiert auf einem rekurrenten neuronalen Netzwerk mit langen Kurzzeitgedächtnis (engl. long short-term memory - LSTM). Die Funktionalität des entworfenen Werkzeugs wird anhand von händischen Transkriptionen sowie einem Testdatensatz des Switchboard-Korpus getestet. Auf diesen beiden Datensätzen wird entsprechend ein F1-Wert von 0,710 beziehungsweise 0,792 erreicht.


Volltext §
DOI: 10.5445/IR/1000086950
Veröffentlicht am 25.10.2018
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Programmstrukturen und Datenorganisation (IPD)
Publikationstyp Hochschulschrift
Publikationsjahr 2018
Sprache Deutsch
Identifikator urn:nbn:de:swb:90-869502
KITopen-ID: 1000086950
Umfang 66 S.
Art der Arbeit Abschlussarbeit - Bachelor
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page