Benchmarks sollen die Leistung von großen Sprachmodellen objektiv bestimmen. Häufig haben sie aber keinen Bezug dazu, wie KI-Tools in der echten Welt benutzt werden oder sind schlicht veraltet. Damit Benchmarks relevant bleiben, muss sich das ändern.
Dieser Artikel wurde indexiert von t3n.de – Software & Entwicklung
Lesen Sie den originalen Artikel: