KIT | KIT-Bibliothek | Impressum | Datenschutz

Continually learning new languages

Pham, Ngoc Quan 1
1 Institut für Anthropomatik und Robotik (IAR), Karlsruher Institut für Technologie (KIT)

Abstract:

Spracherkennung ist die Aufgabe, automatisch Transkriptionen von gegebenen Sprachäußerungen zu erstellen. Dieser Forschungsbereich findet in unserem täglichen Leben breite Anwendung, z. B. bei der Unterstützung ausländischer Studierenden in Vorlesungen oder bei der Steuerung intelligenter Geräte wie Smart-TVs oder Autos durch Sprachbefehle.

Die 7000 Sprachen, die auf der Welt gesprochen werden, stellen eine Herausforderung für Spracherkennungssysteme dar. Herkömmliche Spracherkennungsmethoden, die Hidden Markov-Modelle verwenden, sind in der Praxis nicht für viele Sprachen gleichzeitig anwendbar, da sie Aussprachewörterbücher und eine Pipeline von getrennten Komponenten erfordern. ... mehr

Abstract (englisch):

Speech recognition is the task of automatically generating transcriptions of given speech utterances. This research area is widely applied in our daily lives such as helping foreign students in lectures or controlling intelligent devices such as smart TVs or cars with speech commands.

The 7000 languages being spoken in the world poses a challenge to speech recognition system. Traditionally speech recognition methods using Hidden Markov Model are not practically applicable for many languages simultaneously due to the requirement of pronunciation dictionaries together with a pipeline of separated components. ... mehr


Volltext §
DOI: 10.5445/IR/1000164125
Veröffentlicht am 01.12.2023
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Anthropomatik und Robotik (IAR)
Publikationstyp Hochschulschrift
Publikationsdatum 01.12.2023
Sprache Englisch
Identifikator KITopen-ID: 1000164125
Verlag Karlsruher Institut für Technologie (KIT)
Umfang xvi, 191 S.
Art der Arbeit Dissertation
Fakultät Fakultät für Informatik (INFORMATIK)
Institut Institut für Anthropomatik und Robotik (IAR)
Prüfungsdatum 02.02.2023
Schlagwörter Deep learning, Speech Recognition, Speech Translation, Continual Learning
Referent/Betreuer Waibel, Alexander
Watanabe, Shinji
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page