KIT | KIT-Bibliothek | Impressum | Datenschutz

Scalable and Efficient Uncertainty Estimation and Reduction in Edge-AI Accelerators

Ahmed, Soyed Tuhin ORCID iD icon 1
1 Institut für Technische Informatik (ITEC), Karlsruher Institut für Technologie (KIT)

Abstract:

In den letzten Jahren haben Fortschritte im Bereich der künstlichen Intelligenz (KI) zu einem weit verbreiteten Einsatz neuronaler Netze (NN) in verschiedenen Bereichen geführt, z. B. in der Computer Vision, der Spracherkennung und der Verarbeitung natürlicher Sprache. Die Leistungsverbesserung geht jedoch auf Kosten einer beträchtlichen Anzahl von Parametern und Berechnungsanforderungen. Daher werden KI-Anwendungen überwiegend in der Cloud eingesetzt. Die NN-Inferenz in der Cloud ist jedoch für Echtzeit- und verzögerungsempfindliche Edge-Anwendungen aufgrund geringer Latenzzeiten, Bandbreitenbeschränkungen und Datenschutzbedenken unpraktisch. ... mehr

Abstract (englisch):

In recent years, advancements in artificial intelligence (AI) have led to the widespread deployment of neural networks (NNs) in various domains, such as computer vision, speech recognition, and natural language processing. However, performance improvement comes at the cost of a substantial number of parameters and computation requirements. Thus, the deployment of AI applications predominantly relies on cloud computing. However, NN inference in the cloud is impractical for real-time and delay-sensitive edge applications due to low latency, bandwidth limitations, and privacy concerns. ... mehr


Volltext §
DOI: 10.5445/IR/1000173878
Veröffentlicht am 05.11.2024
Cover der Publikation
Zugehörige Institution(en) am KIT Institut für Technische Informatik (ITEC)
Publikationstyp Hochschulschrift
Publikationsdatum 05.11.2024
Sprache Englisch
Identifikator KITopen-ID: 1000173878
Verlag Karlsruher Institut für Technologie (KIT)
Umfang 325 S.
Art der Arbeit Dissertation
Fakultät Fakultät für Informatik (INFORMATIK)
Institut Institut für Technische Informatik (ITEC)
Prüfungsdatum 15.07.2024
Schlagwörter Edge AI, Uncertainty Estimation, Uncertainty Reduction, Neuromorphic Computing, Compute-in-Memory, Deep Learning, Spintronics, Memristor, Efficient AI, Robust AI, Computer Architecture, Design Automation, robust deep learning
Referent/Betreuer Tahoori, Mehdi B.
Chakrabarty, Krishnendu
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page