美团开源560B参数定理证明模型,72次推理通过率97.1%刷新开源SOTA
美团LongCat团队于3月21日开源了LongCat-Flash-Prover,一个5600亿参数的MoE模型,专注于Lean4形式化定理证明。模型分为自动形式化、草图生成和完整证明生成三项能力,结合推理工具与Lean4编译器实现实时验证。训练采用Hybrid-Experts Iteration Framework和HisPO算法,防止奖励作弊。基准测试表明,该模型在自动形式化和定理证明方面刷新了开源权重模型的记录。