KIT | KIT-Bibliothek | Impressum | Datenschutz

Factorized-VITS: Decoupling Prosody and Text in End-to-End Speech Synthesis without External or Secondary Aligner

Liu, Yining 1; Waibel, Alexander 1
1 Karlsruher Institut für Technologie (KIT)


Originalveröffentlichung
DOI: 10.1109/ICASSP49660.2025.10890003
Scopus
Zitationen: 1
Dimensions
Zitationen: 1
Zugehörige Institution(en) am KIT Institut für Anthropomatik und Robotik (IAR)
Publikationstyp Proceedingsbeitrag
Publikationsdatum 06.04.2025
Sprache Englisch
Identifikator ISBN: 979-8-3503-6875-8
ISSN: 1520-6149
KITopen-ID: 1000184476
Erschienen in ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
Veranstaltung IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2025), Hyderabad, Indien, 06.04.2025 – 11.04.2025
Verlag Institute of Electrical and Electronics Engineers (IEEE)
Seiten 1–5
Nachgewiesen in OpenAlex
Dimensions
Scopus
KIT – Die Universität in der Helmholtz-Gemeinschaft
KITopen Landing Page