| Zugehörige Institution(en) am KIT | Institut für Anthropomatik und Robotik (IAR) |
| Publikationstyp | Proceedingsbeitrag |
| Publikationsdatum | 06.03.2026 |
| Sprache | Englisch |
| Identifikator | ISBN: 979-8-3315-5511-5 KITopen-ID: 1000194438 |
| Erschienen in | 2026 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV) |
| Veranstaltung | IEEE/CVF Winter Conference on Applications of Computer Vision (WACV 2026), Tucson, AZ, USA, 06.03.2026 – 10.03.2026 |
| Verlag | Institute of Electrical and Electronics Engineers (IEEE) |
| Seiten | 3939 - 3950 |
| Externe Relationen | Siehe auch |
| Schlagwörter | multimodal learning, embodied reference understanding, multimodal visual grounding |
| Nachgewiesen in | Scopus OpenAlex |