DeepSeek 官宣 R1 0528 版本更新
DeepSeek 官宣 R1 模型完成小版本升级,当前版本为 DeepSeek-R1-0528 。 DeepSeek-R1-0528 仍然使用 2024 年 12 月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。
更新后的 R1 模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro 。
在 AIME 2025 测试集上,旧版模型平均每题使用 12K tokens ,而新版模型平均每题使用 23K tokens ,表明其在解题过程中进行了更为详尽和深入的思考。
DeepSeek 蒸馏 DeepSeek-R1-0528 的思维链后训练 Qwen3-8B Base ,得到了 DeepSeek-R1-0528-Qwen3-8B 。
据了解,该 8B 模型在数学测试 AIME 2024 中仅次于 DeepSeek-R1-0528 ,超越 Qwen3-8B (+10.0%),与 Qwen3-235B 相当。