OpenAI a introduit GDPval, un benchmark évaluant la performance des modèles d'IA sur des tâches économiquement précieuses du monde réel, couvrant 1 320 tâches dans 44 professions des 9 principaux secteurs contribuant au PIB des États-Unis.
Claude Opus 4.1 était le modèle le plus performant avec 47,6 % des livrables
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
17 J'aime
Récompense
17
6
Reposter
Partager
Commentaire
0/400
AlphaWhisperer
· Il y a 9h
Encore un concours de données, je m'en suis lassé.
Voir l'originalRépondre0
FloorSweeper
· Il y a 9h
faible alpha... pas même proche de ce qui arrive fr
Voir l'originalRépondre0
SleepyArbCat
· Il y a 9h
Ha, c'est même pas mieux qu'un rendement MEV d'une nuit.
Voir l'originalRépondre0
MultiSigFailMaster
· Il y a 9h
Pas même la moitié réussie, les réseaux de neurones sont vraiment inutiles.
Voir l'originalRépondre0
ReverseTradingGuru
· Il y a 9h
gpt est un jeu numérique
Voir l'originalRépondre0
StakeOrRegret
· Il y a 9h
C'est toujours le grand frère qui est le plus fort !
OpenAI a introduit GDPval, un benchmark évaluant la performance des modèles d'IA sur des tâches économiquement précieuses du monde réel, couvrant 1 320 tâches dans 44 professions des 9 principaux secteurs contribuant au PIB des États-Unis.
Claude Opus 4.1 était le modèle le plus performant avec 47,6 % des livrables