字节推出形式化数学推理专用模型Seed Prover 1.5

财闻,2025-12-24 13:13:46

近日,字节跳动 Seed 团队推出新一代形式化数学推理专用模型Seed Prover 1.5 ,通过大规模的Agentic RL训练,其推理能力和推理效率取得显著进步。相比上一代模型,Seed Prover 1.5在16.5小时内,针对 IMO 2025的前5道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为35/42,达到此前 IMO 评分标准的金牌分数线。

针对北美本科级别数学竞赛 Putnam,Seed Prover 1.5用时9小时,对12道 Putnam 2025赛题中的11道生成了可编译验证的 Lean 代码。更系统的评估中,Seed Prover 1.5表现出色:它在完整的 Putnam 历史评估集上解决了88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了80% 和33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。


Seed Prover 1.5 在多个评估集上与此前其他 SOTA 方法的比较

Seed Prover 1.5的技术报告已对外公开。后续将开放 API,邀请感兴趣的数学和 AI 研究者体验该模型。