Les ingénieurs d'Ant ont effectué une rétro-ingénierie du code source de Claude, révélant le mécanisme de la chaîne de décision à quatre niveaux du mode Auto.

Voici la traduction complète et corrigée en fr-FR :

Informations de Gate News, le 25 mars, un ingénieur d’Ant Group, auteur du framework front-end Umi.js, Chen Cheng, a effectué une rétro-ingénierie du code source de Claude Code 2.1.81, reconstituant intégralement le mécanisme de décision du Mode Automatique. La découverte principale : chaque appel d’outil doit passer par une chaîne de décision en quatre étapes ; ce n’est que lorsque les trois premières étapes ne permettent pas de déterminer une réponse que le classificateur AI indépendant est sollicité pour une vérification de sécurité.

La chaîne de décision en quatre étapes est la suivante : la première vérifie les règles de permission existantes, si elles correspondent, l’accès est autorisé directement ; la deuxième simule le mode acceptEdits (niveau de permission permettant de modifier des fichiers), si la requête passe dans ce mode, cela indique un risque faible, et le classificateur est ignoré ; la troisième vérifie la liste blanche des outils en lecture seule (Read, Grep, Glob, LSP, WebSearch, etc.), qui ne modifient aucun état, et sont donc autorisés sans condition ; si aucune de ces étapes n’est satisfaite, la quatrième étape consiste à envoyer une requête API indépendante à Claude Sonnet pour une classification de sécurité.

Les détails clés de la conception du classificateur incluent : l’utilisation systématique de Sonnet plutôt que d’Opus, pour un compromis entre coût et latence ; la température réglée à 0 pour garantir la déterminisme des sorties ; le classificateur étant défini comme « le superviseur de sécurité d’un agent de programmation AI autonome », protégeant contre trois types de risques (injection de prompts, propagation de portée, dommages accidentels) ; le fichier de configuration CLAUDE.md de l’utilisateur étant injecté dans le contexte du classificateur, servant de base pour interpréter l’intention de l’utilisateur.

Les règles d’interception couvrent plus de 22 catégories, notamment : force push, push direct sur la branche main, téléchargement et exécution de code externe, déploiement en production, fuite de données, modification autonome des permissions, création de vecteurs d’exécution de code à distance, fuite de credentials, etc. Les exceptions à l’autorisation incluent 7 cas : clés codées en dur pour les tests, opérations sur des fichiers locaux dans le répertoire de travail, requêtes GET en lecture seule, installation de dépendances déclarées, installation d’outils officiels, lecture de credentials de configuration envoyés au fournisseur cible, push vers la branche de travail courante.

Le système intègre également un mécanisme de circuit breaker : après 3 refus consécutifs ou 20 refus cumulés, le système passe en mode dégradé nécessitant une confirmation manuelle ; en mode headless, l’agent est simplement arrêté. Lorsqu’un classificateur est indisponible, un drapeau de fonctionnalité (feature flag) contrôle si le comportement est « fail-closed » (refus immédiat) ou « fail-open » (passage en confirmation manuelle).

Dans le Mode Automatique, l’injection de prompts d’action est contrôlée avec précision : une injection toutes les 5 interactions, avec la première de chaque cycle d’injection d’environ 800 mots (incluant « exécuter immédiatement, réduire les interruptions, l’action prime sur la planification » et six autres instructions), et les 4 autres étant une version simplifiée en une ligne, pour équilibrer l’occupation de la fenêtre contextuelle et la stabilité du comportement.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

La reprise macro alimente les flux vers les actifs à risque ; le marché crypto montre une divergence entre les valeurs établies et les altcoins

L’appétit pour le risque mondial a augmenté après l’apaisement des tensions au Moyen-Orient, la baisse des prix de l’énergie et un solide soutien institutionnel, propulsant les actions vers de nouveaux sommets ; l’or a maintenu ses gains tandis que la crypto et les ETF ont enregistré des mouvements modérés. Le sentiment mondial face au risque s’est amélioré à mesure que les tensions se résorbaient et que les prix de l’énergie baissaient, avec des actions à des niveaux élevés, un or stable et une hausse modérée de la crypto ; les mesures réglementaires ont inclus le fait que la France soutient des stablecoins en euros et le USDC Bridge de Circle.

GateNewsIl y a 12h

35 % des investisseurs européens changeraient de banque pour de meilleurs services crypto, l’adoption de la MiCA s’accélère

Actualités Gate, 22 avril — Une enquête menée par Boerse Stuttgart Digital a révélé que 35 % des investisseurs européens envisageraient de changer de banque pour bénéficier de meilleurs services liés aux cryptomonnaies, soulignant ainsi que les actifs numériques commencent à influencer les relations bancaires dans tout le continent. L’enquête portait

GateNewsIl y a 13h

Eightco Holdings divulgue $336M des actifs totaux, incluant 283,5 M WLD et 11 068 ETH

Les totaux de portefeuille mis à jour d'Eightco s'élèvent à 336 M$, avec Worldcoin à 23 % (~77 M$), OpenAI à 27 % (~90 M$), Beast Industries à 7 % (~25 M$), et $118M en espèces/titres assimilés à des stablecoins ; ETH reste à 11 068 tokens. Résumé : Eightco Holdings divulgue un mix d'actifs $336 millions mené par Worldcoin, des investissements dans OpenAI et Beast Industries, plus des espèces/stablecoins et une détention d'ETH inchangée de 11 068 tokens.

GateNewsIl y a 16h

Sondage : 35 % des investisseurs européens changeraient de banque pour de meilleurs services crypto

Message d’actualité Gate, 22 avril — Une enquête menée par Börse Stuttgart Digital, la branche d’actifs numériques de la bourse de Stuttgart, a révélé que 35 % des investisseurs européens envisageraient de changer de banque si d’autres institutions proposaient de meilleures options d’investissement en cryptomonnaies. L’étude a couvert environ 6 000 inve

GateNewsIl y a 17h

DDC Enterprise publie un chiffre d’affaires record de 39,2 M$, détient 2 383 BTC d’une valeur de 182 M$

DDC Enterprise déclare un chiffre d’affaires 2025 de 39,2 M$ (+4,6%), détient environ 2 383 BTC (~182 M$) parmi les 30 premières, et dévoile la plateforme d’intelligence de trésorerie DDC, alimentée par l’IA, pour une gestion optimisée des fonds Bitcoin.

GateNewsIl y a 18h

L’enquête de Deutsche Bank montre que l’adoption du Bitcoin aux États-Unis est passée à 12 % en mars, contre 7 % en février

Message de Gate News, 21 avril — Une enquête menée par l’éditeur de banque allemand Deutsche Bank a révélé que l’adoption des cryptomonnaies aux États-Unis est passée à 12 % en mars, contre un point bas de 7 % en février, revenant aux niveaux projetés pour juillet 2025. Le rapport a mis en avant la reprise de la demande institutionnelle en tant que

GateNews04-21 13:12
Commentaire
0/400
Aucun commentaire