蚂蚁工程师逆向 Claude Code 源码,揭示 Auto Mode 四层决策流水线机制

GateNews

Gate News 消息,3 月 25 日,蚂蚁集团工程师、前端框架 Umi.js 作者陈成逆向了 Claude Code 2.1.81 的源码,完整还原了 Auto Mode 的决策机制。核心发现:每一次工具调用都要经过四层决策流水线,只有前三层都无法判断时,才会调用独立的 AI 分类器做安全审查。

四层流水线依次为:第一层检查已有的权限规则,命中直接放行;第二层模拟 acceptEdits 模式(允许编辑文件的权限级别),如果在该模式下就会通过,说明风险很低,跳过分类器;第三层检查只读工具白名单(Read、Grep、Glob、LSP、WebSearch 等),这些不修改任何状态,无条件放行;以上都不满足时,才进入第四层,发送独立的 API 请求给 Claude Sonnet 做安全分类。

分类器的关键设计细节包括:始终使用 Sonnet 而非 Opus,是成本和延迟的权衡;temperature 设为 0 以确保输出确定性;分类器被定义为「自主 AI 编程 Agent 的安全监控员」,保护三类风险(提示词注入、范围蔓延、意外损害);用户的 CLAUDE.md 配置文件会被注入分类器上下文,作为判断用户意图的依据。

拦截规则覆盖 22 个以上类别,包括 force push、直推 main 分支、下载并执行外部代码、生产部署、数据外泄、自我修改权限、创建远程代码执行面、凭证泄露等。放行例外有 7 类:测试用的硬编码密钥、工作目录内的本地文件操作、只读 GET 请求、安装已声明的依赖、官方工具链安装、读取配置凭证发送到目标提供商、推送到当前工作分支。

系统还设置了熔断机制:连续 3 次被拒绝或累计 20 次被拒绝后,系统降级为手动确认;headless 模式下直接中止 Agent。分类器不可用时,由一个 feature flag 控制是「fail-closed」(直接拒绝)还是「fail-open」(降级为手动确认)。

Auto Mode 下的行为提示词注入有精细的频率控制:每 5 轮对话注入一次,每 5 次注入周期中第 1 次是完整版(约 800 字,包含「立即执行、减少打断、行动优于计划」等六条指令),其余 4 次是一行精简版,在上下文窗口占用和行为稳定性之间取得平衡。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

代币化的美国国债在2026年4月达到$14B 里程碑

代币化的美国国债截至2026年4月已达到$14 0亿美元的创纪录水平,较2023年初增长了37倍;据Token Terminal数据。此次激增使国债在更广泛的$29 0亿美元现实世界资产 (RWA) 领域中成为避风港,尽管仍存在显著的f

Crypto Frontier6小时前

摩根大通:DeFi 安全漏洞利用与停滞的 TVL 限制机构采用

Gate News 消息,4月23日——摩根大通分析师、由董事总经理 Nikolaos Panigirtzoglou 领队表示,持续存在的去中心化金融 (DeFi) 漏洞利用以及增长乏力,继续限制机构对该领域的兴趣。根据周三的报告,近期 Kelp DAO 黑客攻击已在短短几天内从 DeFi 的总价值锁定 $20 TVL 中抹去约 十亿美元

GateNews7小时前

2026 年第一季度加密采用放缓,发达市场出现更明显下滑

Gate News 消息,4月23日——根据 TRM Labs 的 2026 年第一季度研究报告,全球加密货币零售采用出现收缩迹象,全球零售总量达到 $979 十亿,较 2025 年同一时期下降 11%。加密货币市场目前已出现连续两个

GateNews9小时前

DeFi 研究人员提出用于借贷金库的信用风险量化框架

Gate 新闻消息,4月23日——包括 Anastasiia 在内的研究人员已发表一篇题为《Vault 作为信用工具》的论文,提出用于 DeFi 借贷金库的信用风险量化框架。研究指出,尽管 DeFi 借贷金库管理真实用户存款,但它们缺乏统一的信用风险评估标准。

GateNews9小时前

摩根大通:DeFi 黑客频传与 TVL 停滞压缩机制引发兴趣,资金转投 USDT

摩根大通报告认为DeFi持续漏洞、跨链桥与预言机攻击频繁,致使TVL停滞、削弱机构投资意愿,资金转向可追踪、可冻结的USDT。KelpDAO与Rhea Finance的攻击揭示了风控风险;中心化稳定币与托管更受青睐;长期要改善需超越保險与治理,DeFi难回到2021年高TVL,稳定币将更集中。

鏈新聞abmedia9小时前

Lido 提议提供 5.8M 美元资金以解决来自 LayerZero 漏洞利用导致的 Kelp rsETH 赤字

Gate News 消息,4月24日——根据周四发布的一项提案,Lido Labs 正寻求 DAO 批准,将最多 2,500 枚质押以太坊 (roughly $5.8 million) 用于减少近期 Kelp 事件中引发的 rsETH 赤字。据称,该笔资金仅会作为一揽子完全融资的复苏方案的一部分提供。这个方案旨在彻底弥合 rsETH 的资金缺口。 The Kelp DAO rsETH 桥在上周遭遇了一次基于 LayerZero 的漏洞利用,导致约 million 的损失。这次攻击造成了 rsETH 的实质性支持短缺,并引发了贯穿 DeFi 的更广泛的二阶影响。Aave 经历了显著的连锁反应,攻击者使用被盗、与 Kelp 相关的资产作为抵押品;该平台的总锁定价值(TVL)下降了近 billion,留下约 million 的坏账。rsETH 赤字也引发了市场利率压力,放大了借贷与出借的紧张程度,并对用户在金库与循环策略中出现被迫平仓的风险。 Lido Labs 表示,总体 rsETH 赤字超过 100,000 ETH,预计该复苏载体将包含多名贡献方。Lido DAO 将作为多个利益相关方之一参与,而不是作为唯一的兜底提供方。在 Lido 的提案提出后不久,EtherFi Foundation 也提议贡献 5,000 ETH 以提供额外救助。 Kelp 漏洞利用已促使业界就 DeFi 的安全性与传染风险展开讨论,部分分析师指出,反复发生的黑客事件以及机构方面的犹豫正在推动投资者转向稳定币。

GateNews11小时前
评论
0/400
暂无评论