英伟达推出开源模型，基于 DeepSeek R1 模型蒸馏

DeepSeek 新闻 2025-07-23 10:51

当 AI 模型正朝着参数规模越来越大、部署成本越来越高的方向狂奔时， NVIDIA 的一项新举措却逆势而为。这两天芯片巨头 NVIDIA 发布了开源推理模型家族 OpenReasoning Nemotron 。

另外之前 DeepSeek 导航网还分享过：德国团队基于 DeepSeek 打造 R1T2 模型，速度碾压官方版

这个基于中国 DeepSeek 公司的 DeepSeek R1 模型、通过 "知识蒸馏" 技术诞生的系列模型，不仅将顶尖推理能力带入普通开发者的视野，更透露了 NVIDIA 从硬件制造商向 AI 生态平台商转型的深层野心。

https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01

从硬件霸主到生态枢纽

OpenReasoning-Nemotron 的诞生，始于一个看似反常识的选择：作为 AI 芯片领域的绝对领导者， NVIDIA 没有选择自研模型作为基础，而是以中国 DeepSeek 公司的 671B 参数模型 DeepSeek R1 为基础，通过知识蒸馏技术培育出 1.5B、7B、14B、32B 参数的四个 "私生" 模型，并以支持商用的开源许可对外发布。

而这一决策的背后，是 NVIDIA 清晰的战略转型逻辑，也就是想从单纯的硬件供应商，升级为 AI 开发的核心平台商。在 Google、OpenAI 等巨头通过封闭 API 掌控高端 AI 能力的当下， NVIDIA 选择以开源姿态释放高性能模型，实则是用 "技术普惠" 吸引全球开发者。

当更多开发者基于 OpenReasoning-Nemotron 开发应用时，其底层依赖的 NVIDIA GPU、CUDA 架构、NeMo 框架自然会成为首选，从而巩固自身在 AI 生态中的核心地位。

选择 DeepSeek R1 作为基础，则体现了对技术实力的务实考量。在数学推理、科学计算、代码生成等考验逻辑能力的领域， DeepSeek R1 目前代表着全球顶尖水平。正如 "最好的老师才能教出最好的学生"， NVIDIA 的选择无关企业归属，只为打造最优质的开源工具。

让小模型拥有 "大智慧" 的核心技术

OpenReasoning-Nemotron 的突破，离不开 "知识蒸馏" 这一关键技术。这项由 Geoffrey Hinton 等人提出的技术，颠覆了传统 AI 学习模式：

传统学习中，模型仅需记住 "标准答案"（如 "这张图是狗"）；而知识蒸馏则要求 "教师模型" 传递更丰富的 "暗知识" —— 比如 "这张图有 60% 概率是狗， 30% 像猫， 9% 像狼" 的概率分布（软目标）。这种 "软目标" 包含了概念间的关联性和世界的底层逻辑，能让 "学生模型" 在更小的参数规模下，更高效地理解事物本质。

此前，知识蒸馏已在 DistilBERT（BERT 的轻量版）等模型中证明价值。而 NVIDIA 此次将其应用于顶尖推理模型，实现了 "瘦身不缩水"：32B 参数的 Nemotron 模型在 AIME24（高级数学竞赛级测试）中拿下 89.2 分，配合 "GenSelect" 多答案筛选技术，部分场景性能甚至媲美 OpenAI 的 o3-high 。

https://arxiv.org/abs/1910.01108

更特别的是，这些模型仅通过蒸馏训练，未使用强化学习，为研究者提供了干净的实验场，加速推理 AI 的技术探索。

开源模型的 "硬核实力"

从基准测试来看， OpenReasoning-Nemotron 家族展现出惊人的效率。

其中， 32B 模型在高级数学推理上的表现尤为亮眼，接近专业人类水平。这种性能让小参数模型（如 7B）有望在高性能游戏 PC 上本地运行，使开发者无需依赖昂贵云服务，即可搭建强推理能力的 AI 应用。

从少数人专属到全民共创

OpenReasoning-Nemotron 的发布，将深刻改变 AI 的发展轨迹。

从本质上看，这是 NVIDIA 推动 "AI 民主化" 的关键一步。让顶尖推理能力走出巨头的数据中心，成为每个开发者和用户都能触及的工具。当 AI 技术从封闭垄断走向开源共创，其创新速度和应用边界都将被重新定义。

OpenReasoning-Nemotron 不仅是一次技术发布，更是 AI 行业从硬件比拼向生态共建转型的缩影。而 NVIDIA 正用开源的力量，将自身的生态影响力延伸至 AI 的每一个角落 —— 而这，或许正是未来 AI 竞争的核心逻辑。

https://www.marktechpost.com/2025/07/19/nvidia-ai-releases-openreasoning-nemotron-a-suite-of-reasoning-enhanced-llms-distilled-from-deepseek-r1-0528/