KIT | KIT-Bibliothek | Impressum | Datenschutz

Ressourcenbasierte Inferenz-Partitionierung von Deep Neural Networks in eingebetteten Systemen

Kreß, Fabian ORCID iD icon 1
1 Institut für Technik der Informationsverarbeitung (ITIV), Karlsruher Institut für Technologie (KIT)

Abstract:

In vielen Anwendungsbereichen, wie der Robotik oder im Automobilbereich, in denen eine große Anzahl von Sensoren integriert ist, sind eingebettete Systeme zu finden. Diese erzeugen oft große Datenmengen, die in möglichst kurzer Zeit von den sensornahen Plattformen an die zentrale Steuereinheit übertragen werden müssen. Folglich benötigen solche Plattformen hohe Linkbandbreiten für die Verbindungen zwischen den eingesetzten Komponenten. Der zunehmende Einsatz von Künstlicher Intelligenz (KI) in vielen dieser Anwendungen stellt darüber hinaus weitere Anforderungen an das Gesamtsystem. ... mehr

Abstract (englisch):

Embedded systems can be found in many application areas, such as robotics or the automotive industry, in which a large number of sensors are integrated. These systems often generate large amounts of data, which must be transferred from the near-sensor platforms to the central control unit in the shortest possible time. Consequently, such platforms require high link bandwidths for the connections between the components used. The increasing use of artificial intelligence (AI) in many of these applications also places further demands on the overall system. In particular, safety-critical applications such as autonomous driving require high data throughput and low latency to process computationally intensive deep neural networks (DNNs). ... mehr

Zugehörige Institution(en) am KIT Institut für Technik der Informationsverarbeitung (ITIV)
Publikationstyp Hochschulschrift
Publikationsdatum 18.03.2025
Sprache Deutsch
Identifikator KITopen-ID: 1000180033
Verlag Karlsruher Institut für Technologie (KIT)
Umfang xiii, 223 S.
Art der Arbeit Dissertation
Fakultät Fakultät für Elektrotechnik und Informationstechnik (ETIT)
Institut Institut für Technik der Informationsverarbeitung (ITIV)
Prüfungsdatum 19.12.2024
Schlagwörter Deep Neural Network Inference, Embedded Computing, Inference Partitioning, Approximate Computing, Embedded Systems, Internet-of-Things, Chiplet, Artificial Intelligence, Machine Learning, Convolutional Neural Network, Hardware Accelerator, Optimization, Processing-In-Memory, In-Memory Computing, Non-volatile memory, Microcontroller, Quantization-Aware Training, LSTM, FPGA
Referent/Betreuer Becker, Jürgen
Berekovic, Mladen

Volltext §
DOI: 10.5445/IR/1000180033
Veröffentlicht am 18.03.2025
Seitenaufrufe: 9
seit 19.03.2025
Downloads: 3
seit 20.03.2025
Cover der Publikation
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page