DeepSeek 发布 V3.2 两款新模型

DeepSeek 新闻 2025-12-02 10:28

深度求索 DeepSeek 正式发布了 V3.2 系列模型，包括标准版「DeepSeek-V3.2」与增强版「DeepSeek-V3.2-Speciale」。

DeepSeek-V3.2 的定位是「全能型」模型，目标在于平衡推理能力与输出长度，适合日常问答与通用 Agent 场景。
官方测试显示，该模型在公开推理类 Benchmark 中达到了 GPT-5 水平，仅略低于 Gemini-3.0-Pro 。同时，相比 Kimi-K2-Thinking ， V3.2 输出更为简洁，大幅降低了计算开销与用户等待时间。

DeepSeek-V3.2 还首次实现了「思考模式下的工具调用」，通过大规模 Agent 训练数据合成方法，显著提升了模型的泛化能力。这一功能使模型能够在复杂任务中多轮思考并调用工具，最终给出更详尽准确的回答。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2

DeepSeek-V3.2-Speciale 被称为「逻辑怪兽」，是标准版的长思考增强版，结合了 DeepSeek-Math-V2 的定理证明能力。
该模型在数学与编程领域表现突出，成功斩获 IMO 2025、CMO 2025、ICPC 2025 全球总决赛及 IOI 2025 金牌，其成绩已接近甚至超越人类顶尖选手水平。

🤗 HuggingFace: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

👾 ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2-Speciale

目前， DeepSeek-V3.2 系列模型均已开源，其中 V3 模型已在网页端、App 与 API 全面上线，而 V3.2-Speciale 则以临时 API 服务形式开放，供研究与社区评测使用。

官方表示， Speciale 版本消耗的 Tokens 显著更多，成本更高，因此暂未针对日常对话与写作任务进行优化。

📖 技术报告：https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.2/resolve/master/assets/paper.pdf