KIT | KIT-Bibliothek | Impressum | Datenschutz

Influence of input data representations for time-dependent instrument recognition [Einfluss von Eingangsdaten-Darstellungen für die zeitabhängige Instrumentenerkennung]

Schwabe, Markus ORCID iD icon; Heizmann, Michael

Abstract:

Ein wichtiger Vorverarbeitungsschritt für verschiedene Musiksignalverarbeitungsalgorithmen ist die Schätzung der spielenden Instrumente in Musikaufnahmen. Zu diesem Zweck wird die zeitabhängige Instrumentenerkennung in diesem Ansatz durch ein neuronales Netz mit Residual-Blöcken realisiert. Da Musiksignalverarbeitungsaufgaben unterschiedliche Zeit-Frequenz-Darstellungen als Eingabematrizen verwenden, wird in dieser Arbeit der Einfluss verschiedener Eingangsdarstellungen für die Instrumentenerkennung analysiert. Dabei werden sowohl dreidimensionale Eingänge von Kurzzeit-Fourier-Transformation (STFT) mit einer zusätzlichen auf Phaseninformation basierenden Zeit-Frequenz-Darstellung als auch die Magnituden der zweidimensionalen STFT oder der Constant-Q-Transformation (CQT) untersucht. ... mehr

Abstract (englisch):

An important preprocessing step for several music signal processing algorithms is the estimation of playing instruments in music recordings. To this aim, time-dependent instrument recognition is realized by a neural network with residual blocks in this approach. Since music signal processing tasks use diverse time-frequency representations as input matrices, the influence of different input representations for instrument recognition is analyzed in this work. Three-dimensional inputs of short-time Fourier transform (STFT) magnitudes and an additional time-frequency representation based on phase information are investigated as well as two-dimensional STFT or constant-Q transform (CQT) magnitudes. ... mehr


Postprint §
DOI: 10.5445/IR/1000130807
Veröffentlicht am 04.01.2023
Originalveröffentlichung
DOI: 10.1515/teme-2020-0100
Scopus
Zitationen: 2
Dimensions
Zitationen: 3
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Industrielle Informationstechnik (IIIT)
Publikationstyp Zeitschriftenaufsatz
Publikationsdatum 25.02.2021
Sprache Englisch
Identifikator ISSN: 0171-8096
KITopen-ID: 1000130807
Erschienen in Technisches Messen
Band 88
Heft 5
Seiten 274–281
Nachgewiesen in Scopus
Dimensions
Web of Science
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page