OpenAI a introduit GDPval, un benchmark évaluant la performance des modèles d'IA sur des tâches économiquement précieuses du monde réel, couvrant 1 320 tâches dans 44 professions des 9 principaux secteurs contribuant au PIB des États-Unis.



Claude Opus 4.1 était le modèle le plus performant avec 47,6 % des livrables
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 6
  • Reposter
  • Partager
Commentaire
0/400
AlphaWhisperervip
· Il y a 9h
Encore un concours de données, je m'en suis lassé.
Voir l'originalRépondre0
FloorSweepervip
· Il y a 9h
faible alpha... pas même proche de ce qui arrive fr
Voir l'originalRépondre0
SleepyArbCatvip
· Il y a 9h
Ha, c'est même pas mieux qu'un rendement MEV d'une nuit.
Voir l'originalRépondre0
MultiSigFailMastervip
· Il y a 9h
Pas même la moitié réussie, les réseaux de neurones sont vraiment inutiles.
Voir l'originalRépondre0
ReverseTradingGuruvip
· Il y a 9h
gpt est un jeu numérique
Voir l'originalRépondre0
StakeOrRegretvip
· Il y a 9h
C'est toujours le grand frère qui est le plus fort !
Voir l'originalRépondre0
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)