DeepSeek 推出新一代数学推理模型:DeepSeekMath‑V2

DeepSeek 正式推出新一代数学推理模型「DeepSeekMath‑V2」,主打可自我验证的数学推理能力。

该模型基于 DeepSeek‑V3.2‑Exp‑Base 构建,旨在解决传统大模型在复杂推理链条中仅追求最终答案正确率而忽视逻辑严谨性的问题。

DeepSeek 团队指出,模型通过引入基于 LLM 的验证器,对生成的数学证明进行自动审查,并利用扩展的验证计算持续生成高难度训练样本,从而提升验证器的能力。这一机制在定理证明等需要逐步推导的任务中尤为关键。

在实际表现方面, DeepSeekMath‑V2 已在多项国际顶级数学竞赛中展现出强劲实力:在 2025 年国际数学奥林匹克竞赛(IMO 2025)与 2024 年中国数学奥林匹克竞赛(CMO 2024)中均达到金牌水准,并在 2024 年普特南数学竞赛(Putnam 2024)中取得 118/120 的近乎满分成绩。

官方表示,尽管仍有大量工作需要推进,但当前成果已证明「可自验证的数学推理」是一条切实可行的研究路径,有望为构建更强大、更可靠的数学智能系统奠定基础。

🤗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-Math-V2