Vision Language Modelle versagen bei einfachen Bildtests

Auch die größten Vision-Language-Models von OpenAI, Google und Meta können laut einer Studie ganz simple Aufgaben nicht lösen.

Geschrieben am 28. Oktober 2024 Veröffentlicht in .heise_news