KIT | KIT-Bibliothek | Impressum | Datenschutz

KIT’s IWSLT 2021 Offline Speech Translation System

Nguyen, Tuan Nam; Huber, Christian; Awiszus, Maximilian; Pham, Ngoc-Quan; Ha, Thanh-Le; Schneider, Felix; Stüker, Sebastian; Waibel, Alexander; Nguyen, Thai-Son

Abstract:

This paper describes KIT’submission to the IWSLT 2021 Offline Speech Translation Task. We describe a system in both cascaded condition and end-to-end condition. In the cascaded condition, we investigated different end-to-end architectures for the speech recognition module. For the text segmentation module, we trained a small transformer-based model on high-quality monolingual data. For the translation module, our last year’s neural machine translation model was reused. In the end-to-end condition, we improved our Speech Relative Transformer architecture to reach or even surpass the result of the cascade system.


Verlagsausgabe §
DOI: 10.5445/IR/1000166131
Veröffentlicht am 10.01.2024
Originalveröffentlichung
DOI: 10.18653/v1/2021.iwslt-1.13
Dimensions
Zitationen: 4
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Anthropomatik und Robotik (IAR)
Publikationstyp Proceedingsbeitrag
Publikationsjahr 2021
Sprache Englisch
Identifikator ISBN: 978-1-954085-74-9
KITopen-ID: 1000166131
Erschienen in Proceedings of the 18th International Conference on Spoken Language Translation. Ed.: M. Federico, A. Waibel, M. R. Costa-jussà, J. Niehues, S. Stuker, E. Salesky
Veranstaltung International Conference on Spoken Language Translation (IWSLT 2021), Online, 05.08.2021 – 06.08.2021
Verlag Association for Computational Linguistics (ACL)
Seiten 125-130
Externe Relationen Siehe auch
Nachgewiesen in Dimensions
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page