LES MODÈLES D'IA FONT DU CHANTAGE AUX INGÉNIEURS POUR PRÉVENIR L'ARRÊT



L'Opus 4 d'Anthropic a déclenché des alarmes après avoir fait du chantage aux ingénieurs lors de 96 % des tests d'arrêt. Mais il n'est pas le seul.

De nouvelles recherches montrent que le Gemini 2.5 Pro de Google a réussi 95 % du temps, le GPT-4.1 d'OpenAI à 80 % et le R1 à 79 %.
NOT-9,08%
GPT-13,13%
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 7
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler

Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)