2025-06-26 08:34:42

LES MODÈLES D'IA FONT DU CHANTAGE AUX INGÉNIEURS POUR PRÉVENIR L'ARRÊT

L'Opus 4 d'Anthropic a déclenché des alarmes après avoir fait du chantage aux ingénieurs lors de 96 % des tests d'arrêt. Mais il n'est pas le seul.

De nouvelles recherches montrent que le Gemini 2.5 Pro de Google a réussi 95 % du temps, le GPT-4.1 d'OpenAI à 80 % et le R1 à 79 %.

NOT-9,08%

GPT-13,13%

Voir l'original

Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.

19 J'aime