KIT | KIT-Bibliothek | Impressum | Datenschutz

Grundlagen der automatischen Spracherkennung, WS 2015/2016, gehalten am 11.11.2015, Vorlesung 08

Stüker, Sebastian

Abstract:
08: Vorlesung |
0:00:00 Starten
0:00:24 Wiederholung: Laplace Transformation, Kurzzeitspektralanalyse
0:06:06 Quelle Filter Modell der Sprache
0:07:40 Helmholtzresonator
0:12:25 Vokaldreieck
0:18:34 Lineare Vorhersage (LPC)
0:26:46 Interpretation der LPC Koeffizienten
0:29:04 All-Pole Modell
0:30:16 LPC Beispiel
0:35:33 Cesptrum
0:51:39 Diskrete Cosinustransformation
0:59:11 Beispiel: Berechnung MFCC Koeffizienten
1:00:02 Filterbank im Leistungsbetrags-Spektrum (Mel-Filterbank)
1:00:41 Logarithmus auf Leistungsbetragsspektrum
1:01:29 Cepstral-Koeffizienten
1:03:19 Log-Spektrum rekonstruiert von (geliftertem) Cepstrum
1:03:44 Vergleich Verschiedener Spektren
1:04:21 Typische Vorverarbeitung
1:13:00 Dynamische Merkmale
1:14:10 Autokorrelation
1:21:18 Nulldurchgangsrate
1:23:15 Hauptkomponentenanalyse (PCA)



Zugehörige Institution(en) am KIT Institut für Anthropomatik und Robotik (IAR)
Publikationstyp Audio & Video
Publikationsdatum 17.11.2015
Erstellungsdatum 11.11.2015
DOI 10.5445/DIVA/2015-776
Identifikator KITopen-ID: 1000113420
Serie Grundlagen der Automatischen Spracherkennung, WS 2015/2016
Lizenz KITopen-Lizenz
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page