| Zugehörige Institution(en) am KIT | Institut für Anthropomatik und Robotik (IAR) |
| Publikationstyp | Proceedingsbeitrag |
| Publikationsjahr | 2026 |
| Sprache | Englisch |
| Identifikator | KITopen-ID: 1000192828 |
| Erschienen in | The Fourteenth International Conference on Learning Representations |
| Veranstaltung | 14th International Conference on Learning Representations (2016), Rio de Janeiro, Brasilien, 23.04.2026 – 27.04.2026 |
| Verlag | OpenReview.net |
| Vorab online veröffentlicht am | 26.01.2026 |
| Externe Relationen | Siehe auch |
| Schlagwörter | benchmark, crosslingual, multimodal, instruction-following, speech, video |