腾讯开源 Hy3 预览版,代码基准测试较前代提升 40%

Market Whisper

騰訊開源Hy3預覽版

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,至发布日历时不足三个月。

Hy3 模型架构与开发背景

根据腾讯官方公告,Hy3 预览版为混合专家架构,将各查询路由至指定专家子网络子集处理,而非异步启用全部参数,以降低计算需求。

前一代旗舰模型 Hy2 的参数量逾 4,000 亿。腾讯官方声明指出,2,950 亿为推理效益优化后的设置,超出此规模后增加参数的边际效益不再划算。

根据 Decrypt 报导,Hy3 的训练工作由腾讯首席人工智能科学家姚顺宇(Yao Shunyu)主导,其于 2026 年 2 月完成预训练与强化学习堆叠的基础设施重建后,Hy3 训练正式展开。

关键基准测试数据

根据腾讯官方公告所披露的基准测试结果:

SWE-bench Verified(GitHub 真实代码错误修复):Hy3 预览版 74.4%,Hy2 为 53.0%;同期 GLM-5 为 77.8%,Kimi-K2.5 为 76.8%,Claude Opus 4.6 为 80.8%

Terminal-Bench 2.0(命令行自主执行任务):Hy3 预览版 54.4%,Hy2 为 23.2%

BrowseComp(复杂网络搜索任务):Hy3 预览版 67.1%,Hy2 为 28.7%

WideSearch:Hy3 预览版 70.2%,高于 GLM-5 及 Kimi-K2.5,低于 Claude Opus 4.6 的 77.2%

清华大学数学博士资格考试(2026 年春季):三次运行平均分(avg@3)88.4,为中国模型最高分

2025 年中国高中生物奥林匹克竞赛(CHSBO 2025):87.8 分,为同类中国模型最高分

部署平台与 API 定价

根据腾讯官方公告,Hy3 预览版已部署于以下平台:元宝(Yuanbao)、QQ、腾讯文档(Tencent Docs)、CodeBuddy、WorkBuddy 及 OpenClaw。

腾讯云端 API 定价为每百万输入标记 0.18 美元、每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。腾讯公告亦显示,Hy3 在 CodeBuddy 与 WorkBuddy 上的首标记延迟较前代降低 54%,端对端生成时间缩短 47%,并成功完成 495 步骤的代理工作流程。

常见问题

腾讯 Hy3 预览版何时发布,可在哪些平台取得?

根据腾讯官方公告及 Decrypt 2026 年 4 月 24 日报道,Hy3 预览版于 2026 年 4 月 23 日(周四)在 GitHub、Hugging Face 及 ModelScope 开源,腾讯云端同步提供付费 API 服务。

Hy3 预览版与前代模型 Hy2 相比,主要基准测试差异为何?

根据腾讯官方公告,SWE-bench Verified 评分由 Hy2 的 53.0% 升至 74.4%;BrowseComp 由 28.7% 升至 67.1%;Terminal-Bench 2.0 由 23.2% 升至 54.4%。

Hy3 预览版的 API 定价为何?

根据腾讯云端官方定价,Hy3 预览版 API 起价为每百万输入标记 0.18 美元,每百万输出标记 0.59 美元;个人标记计划月费起价约 4.10 美元。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

黄仁勳驳斥 AI 末日论:未来将创造大规模新兴就业机会

辉达执行长黄仁勋在全球性座谈表示对 AI 并非末日,并认为 AI 将推动美国再工业化与创造就业。他预测下一波“代理式 AI”将使 GPU 需求暴增千倍,需新型工业级基础设施与庞大劳动力市场。他强调 AI 提升生产力、非取代人力,并呼吁负责任开发与跨国安全标准;就业与经济影响仍需长期观察。

鏈新聞abmedia8 分钟前

OpenAI 加速 AI 代理手机至 2027 年上半年,联发科将争取独家处理器合作协议

据分析师 Ming-Chi Kuo 最新的行业调查,OpenAI 正加速开发其首款 AI 代理手机,并力争最早在 2027 年上半年实现量产。如今,联发科更有可能拿下独家处理器订单,芯片将基于一款定制版本的

GateNews11 分钟前

Sierra 募资 9.5 亿美元、估值 158 亿美元:Bret Taylor 以 OpenAI 主席身分抢夺 AI 客服龙头

Sierra 由 Bret Taylor 共同创办,宣布完成 9.5 亿美元 Series E、估值 158 亿美元,由 Tiger Global 与 GV 首投。8 季达成 1.5 亿 ARR、Fortune 50 渗透率超过 40%。定位为以 AI agent 为核心的垂直企业客服平台,提供即用型工作流。Taylor 同时为 OpenAI 董事长,治理与利益披露成焦点。

鏈新聞abmedia1小时前

Gemini API 推出 Webhooks:Google 解决长期任务轮询痛点、Batch/Veo 可即时推送

Google Gemini API 于 5 月 4 日推出 Webhooks。长任务完成时会自动将结果推送到 callback URL,替代轮询,降低资源和延迟、简化程序。适用于 Batch API、Veo2 和长 context 推理,特别适合 serverless。相较 OpenAI 偏 SSE、Anthropic 仍使用轮询,Google 强调开发者基础设施。未来关注安全机制与扩展模型。对台湾开发者而言,立即整合可显著降低 quota 和系统负载。

鏈新聞abmedia1小时前

Krutrim 于 5 月 5 日转向 AI 云服务,并发布首份盈利,随着 FY26 营收达到 3160 万美元

据 Press Trust of India 报道,印度 AI 公司 Krutrim 于 5 月 5 日将自身重新定位为本土 AI 云服务提供商,暂停芯片设计工作,并将资本和人才转向云基础设施。 该公司公布的 26 财年收入约为 30 亿卢比(US$31.6 m

GateNews2小时前
评论
0/400
暂无评论