DeepSeek 发布 V3.2 两款新模型

深度求索 DeepSeek 正式发布了 V3.2 系列模型,包括标准版「DeepSeek-V3.2」与增强版「DeepSeek-V3.2-Speciale」。

DeepSeek-V3.2 的定位是「全能型」模型,目标在于平衡推理能力与输出长度,适合日常问答与通用 Agent 场景。
官方测试显示,该模型在公开推理类 Benchmark 中达到了 GPT-5 水平,仅略低于 Gemini-3.0-Pro 。同时,相比 Kimi-K2-Thinking , V3.2 输出更为简洁,大幅降低了计算开销与用户等待时间。

DeepSeek-V3.2 还首次实现了「思考模式下的工具调用」,通过大规模 Agent 训练数据合成方法,显著提升了模型的泛化能力。这一功能使模型能够在复杂任务中多轮思考并调用工具,最终给出更详尽准确的回答。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale 被称为「逻辑怪兽」,是标准版的长思考增强版,结合了 DeepSeek-Math-V2 的定理证明能力。
该模型在数学与编程领域表现突出,成功斩获 IMO 2025、CMO 2025、ICPC 2025 全球总决赛及 IOI 2025 金牌,其成绩已接近甚至超越人类顶尖选手水平。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

目前, DeepSeek-V3.2 系列模型均已开源,其中 V3 模型已在网页端、App 与 API 全面上线,而 V3.2-Speciale 则以临时 API 服务形式开放,供研究与社区评测使用。

官方表示, Speciale 版本消耗的 Tokens 显著更多,成本更高,因此暂未针对日常对话与写作任务进行优化。

📖 技术报告:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf