KIT | KIT-Bibliothek | Impressum | Datenschutz

AltChart: Enhancing VLM-Based Chart Summarization Through Multi-pretext Tasks

Moured, Omar ORCID iD icon 1; Zhang, Jiaming ORCID iD icon 1; Sarfraz, M. Saquib 2; Stiefelhagen, Rainer ORCID iD icon 1
1 Zentrum für digitale Barrierefreiheit und Assistive Technologien (ACCESS@KIT), Karlsruher Institut für Technologie (KIT)
2 Karlsruher Institut für Technologie (KIT)


Zugehörige Institution(en) am KIT Zentrum für digitale Barrierefreiheit und Assistive Technologien (ACCESS@KIT)
Publikationstyp Proceedingsbeitrag
Publikationsjahr 2024
Sprache Englisch
Identifikator ISBN: 978-3-031-70533-5
ISSN: 0302-9743, 1611-3349
KITopen-ID: 1000174718
Erschienen in Document Analysis and Recognition - ICDAR 2024 – 18th International Conference, Athens, Greece, August 30–September 4, 2024, Proceedings, Part I. Ed.: E. Barney Smith
Veranstaltung IAPR International Conference on Document Analysis and Recognition (ICDAR 2024), Athen, Griechenland, 30.08.2024 – 04.09.2024
Verlag Springer Nature Switzerland
Seiten 349 – 366
Serie Lecture Notes in Computer Science (LNCS) ; 14804
Vorab online veröffentlicht am 08.09.2024
Nachgewiesen in Scopus
Dimensions
KIT – Die Forschungsuniversität in der Helmholtz-Gemeinschaft
KITopen Landing Page