Forscher:innen haben KI-Benchmarks auf die Probe gestellt. Denn eigentlich sollten die Systeme verlässlich aussagen, welche Modelle am besten performen. In der Realität lassen sich die Scores aber mit wenigen Handgriffen manipulieren. So erlangen KI-Systeme Bestnoten, obwohl sie keine einzige Aufgabe erledigt haben.
Dieser Artikel wurde indexiert von t3n.de – Software & Entwicklung
Lesen Sie den originalen Artikel: