DeepSeek 于 4 月 24 日正式推出 V4 预览版系列，以 MIT 许可协议开源，模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告，V4-Pro-Max（最高推理力度模式）在 Codeforces 基准取得 3206 分，超越 GPT-5.4。

两款 MoE 模型架构规格

根据 DeepSeek V4 技术报告，V4 系列包含两款混合专家（MoE）模型：

V4-Pro：总参数 1.6T，每 token 激活 49B，支持 1M token 上下文

V4-Flash：总参数 284B，每 token 激活 13B，同样支持 1M token 上下文

根据技术报告，V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%，KV 缓存降至 V3.2 的 10%，主要得益于混合注意力机制（压缩稀疏注意力 CSA ＋重度压缩注意力 HCA）的架构升级。预训练数据规模超过 32T token；训练优化器更新为 Muon。

后训练方法论：在线策略蒸馏取代混合强化学习

根据 DeepSeek V4 技术报告，V4 后训练的核心更新在于以在线策略蒸馏（On-Policy Distillation，OPD）完全取代 V3.2 的混合强化学习（mixed RL）阶段。新流程分为两步：首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家（SFT ＋ GRPO 强化学习）；随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型，通过 logit 对齐避免传统方法中常见的能力冲突。

报告同时引入生成式奖励模型（Generative Reward Model，GRM），针对难以用规则验证的任务，以少量多样化人工标注数据训练，让模型同时承担生成与评估功能。

基准测试成绩：编码领先，知识推理仍有差距

根据 DeepSeek V4 技术报告，V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果（不含近期发布的 GPT-5.5 及 Opus 4.7）：

Codeforces：3206（GPT-5.4：3168 / Gemini 3.1 Pro：3052）→ 全场最高

LiveCodeBench：93.5 → 全场最高

SWE Verified：80.6，落后 Opus 4.6 的 80.8 差 0.2 个百分点

GPQA Diamond：90.1，落后 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified：57.9，落后 Gemini 3.1 Pro 的 75.6

HLE：37.7，落后 Gemini 3.1 Pro 的 44.4

技术报告同时指出，上述对比不含最近发布的 GPT-5.5 及 Opus 4.7，V4 与最新一代闭源模型的差距有待第三方评测验证。

常见问题

DeepSeek V4 预览版的开源许可条款为何，可在哪里取得？

根据 DeepSeek 4 月 24 日的官方公告，V4 系列以 MIT 许可协议开源，模型权重已上线 Hugging Face 及 ModelScope，适用于商业与学术用途。

DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异？

根据 DeepSeek V4 技术报告，V4-Pro 总参数为 1.6T，每 token 激活 49B；V4-Flash 总参数为 284B，每 token 激活 13B，两款均支持 1M token 上下文。

DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何？

根据 DeepSeek V4 技术报告，V4-Pro-Max 在 Codeforces（3206 分）及 LiveCodeBench（93.5）两项基准超越 GPT-5.4 及 Gemini 3.1 Pro，但在知识密集型基准（GPQA Diamond、SimpleQA-Verified、HLE）上仍落后 Gemini 3.1 Pro；比较组不含 GPT-5.5 及 Opus 4.7。

免责声明：本页面信息可能来自第三方，不代表 Gate 的观点或意见。页面显示的内容仅供参考，不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证，对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为，价格波动剧烈，您可能损失全部投资本金。请充分了解相关风险，并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明。

Palantir 报告称 Q1 收入激增 85%，至 16330亿美元，40 条法则（Rule of 40）得分达到 145%

股票 AI 行业动态

根据 Palantir 2026 年第一季度财报，该数据分析和 AI 软件公司的第一季度营收达到 16330亿美元，同比增长 85%，创下其有史以来最高的增长率。该公司的 Rule of 40 得分（一项衡量综合增长和盈利能力的指标）飙升至

GateNews18 分钟前

Meta 寻求 130 亿美元融资，用于德克萨斯州 AI 数据中心，由摩根士丹利和摩根大通牵头

股票 AI 行业动态

据 Beating 称，Meta 正寻求为其在德克萨斯州的人工智能数据中心筹集约 130 亿美元融资，摩根士丹利和摩根大通正在牵头推动。知情人士表示，该融资结构主要由债务构成，剩余部分为股权，据知情人士

GateNews34 分钟前

Lattice Semiconductor 于 5 月 4 日以 16.5 亿美元收购 AMI，扩展至 AI 基础设施软件

股票 AI 行业动态

据路透社报道，Lattice Semiconductor 于 5 月 4 日宣布，将以 16.5 亿美元收购 AMI，这是一家固件和基础设施软件公司，以便更深入地拓展 AI 系统管理和云基础设施。 AMI 专注于 BIOS 固件以及 Baseboard Management Controller (BMC) 软件

GateNews46 分钟前

香港实验室于 2026 年上半年在中国芯片上推出 HKGAI-V3 AI 模型

AI 行业动态

据《南华早报》报道，香港生成式人工智能研究与发展中心计划在 2026 年上半年推出其 HKGAI-V3 模型，并对系统进行优化，使其能够在中国制造的芯片上运行，包括华为的 Ascend 910C。该模型基于 DeepSeek V4 架构并且

GateNews56 分钟前

AlphaDrive 启动 $100M 以色列 AI 和网络安全基金

AI 行业动态

以色列 Elron Ventures 的前高管 Yaron Elad 和 Elik Etzion 据 Calcalist 报道，已推出 AlphaDrive，这是一只 1 亿美元的基金，专注于网络安全和人工智能。基金结构与投资策略 AlphaDrive 旨在投向由以色列创立的初创企业

Crypto Frontier1小时前

OpenAI 销售负责人 James Dyett 加入 Thrive Capital，担任驻场运营合伙人

AI 行业动态

根据 Beating 的说法，OpenAI 的高级销售负责人 James Dyett 最近宣布离职，以作为驻场运营者加入 Thrive Capital。Dyett 于 2023 年 ChatGPT 热潮期间加入 OpenAI，他表示离开的原因是他更偏好处于早期的公司建设阶段。他提到他