Factorized-VITS: Decoupling Prosody and Text in End-to-End Speech Synthesis without External or Secondary Aligner

Liu, Yining ¹; Waibel, Alexander ¹
¹ Karlsruher Institut für Technologie (KIT)

Originalveröffentlichung
DOI: 10.1109/ICASSP49660.2025.10890003

Scopus
Zitationen: 1

Dimensions
Zitationen: 1

Seitenaufrufe: 81
seit 06.09.2025

Zugehörige Institution(en) am KIT	Institut für Anthropomatik und Robotik (IAR)
Publikationstyp	Proceedingsbeitrag
Publikationsdatum	06.04.2025
Sprache	Englisch
Identifikator	ISBN: 979-8-3503-6875-8 ISSN: 1520-6149 KITopen-ID: 1000184476
Erschienen in	ICASSP 2025 - 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
Veranstaltung	IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2025), Hyderabad, Indien, 06.04.2025 – 11.04.2025
Verlag	Institute of Electrical and Electronics Engineers (IEEE)
Seiten	1–5
Nachgewiesen in	Dimensions Scopus OpenAlex