英伟达推出开源模型,基于 DeepSeek R1 模型蒸馏
当 AI 模型正朝着参数规模越来越大、部署成本越来越高的方向狂奔时, NVIDIA 的一项新举措却逆势而为。这两天芯片巨头 NVIDIA 发布了开源推理模型家族 OpenReasoning Nemotron 。
另外之前 DeepSeek 导航网还分享过:德国团队基于 DeepSeek 打造 R1T2 模型,速度碾压官方版
这个基于中国 DeepSeek 公司的 DeepSeek R1 模型、通过 "知识蒸馏" 技术诞生的系列模型,不仅将顶尖推理能力带入普通开发者的视野,更透露了 NVIDIA 从硬件制造商向 AI 生态平台商转型的深层野心。
https://huggingface.co/collections/nvidia/openreasoning-nemotron-687730dae0170059860f1f01
从硬件霸主到生态枢纽
OpenReasoning-Nemotron 的诞生,始于一个看似反常识的选择:作为 AI 芯片领域的绝对领导者, NVIDIA 没有选择自研模型作为基础,而是以中国 DeepSeek 公司的 671B 参数模型 DeepSeek R1 为基础,通过知识蒸馏技术培育出 1.5B、7B、14B、32B 参数的四个 "私生" 模型,并以支持商用的开源许可对外发布。
而这一决策的背后,是 NVIDIA 清晰的战略转型逻辑,也就是想从单纯的硬件供应商,升级为 AI 开发的核心平台商。在 Google、OpenAI 等巨头通过封闭 API 掌控高端 AI 能力的当下, NVIDIA 选择以开源姿态释放高性能模型,实则是用 "技术普惠" 吸引全球开发者。
当更多开发者基于 OpenReasoning-Nemotron 开发应用时,其底层依赖的 NVIDIA GPU、CUDA 架构、NeMo 框架自然会成为首选,从而巩固自身在 AI 生态中的核心地位。
选择 DeepSeek R1 作为基础,则体现了对技术实力的务实考量。在数学推理、科学计算、代码生成等考验逻辑能力的领域, DeepSeek R1 目前代表着全球顶尖水平。正如 "最好的老师才能教出最好的学生", NVIDIA 的选择无关企业归属,只为打造最优质的开源工具。
让小模型拥有 "大智慧" 的核心技术
OpenReasoning-Nemotron 的突破,离不开 "知识蒸馏" 这一关键技术。这项由 Geoffrey Hinton 等人提出的技术,颠覆了传统 AI 学习模式:
传统学习中,模型仅需记住 "标准答案"(如 "这张图是狗");而知识蒸馏则要求 "教师模型" 传递更丰富的 "暗知识" —— 比如 "这张图有 60% 概率是狗, 30% 像猫, 9% 像狼" 的概率分布(软目标)。这种 "软目标" 包含了概念间的关联性和世界的底层逻辑,能让 "学生模型" 在更小的参数规模下,更高效地理解事物本质。
此前,知识蒸馏已在 DistilBERT(BERT 的轻量版)等模型中证明价值。而 NVIDIA 此次将其应用于顶尖推理模型,实现了 "瘦身不缩水":32B 参数的 Nemotron 模型在 AIME24(高级数学竞赛级测试)中拿下 89.2 分,配合 "GenSelect" 多答案筛选技术,部分场景性能甚至媲美 OpenAI 的 o3-high 。
https://arxiv.org/abs/1910.01108
更特别的是,这些模型仅通过蒸馏训练,未使用强化学习,为研究者提供了干净的实验场,加速推理 AI 的技术探索。
开源模型的 "硬核实力"
从基准测试来看, OpenReasoning-Nemotron 家族展现出惊人的效率。

其中, 32B 模型在高级数学推理上的表现尤为亮眼,接近专业人类水平。这种性能让小参数模型(如 7B)有望在高性能游戏 PC 上本地运行,使开发者无需依赖昂贵云服务,即可搭建强推理能力的 AI 应用。
从少数人专属到全民共创
OpenReasoning-Nemotron 的发布,将深刻改变 AI 的发展轨迹。
从本质上看,这是 NVIDIA 推动 "AI 民主化" 的关键一步。让顶尖推理能力走出巨头的数据中心,成为每个开发者和用户都能触及的工具。当 AI 技术从封闭垄断走向开源共创,其创新速度和应用边界都将被重新定义。
OpenReasoning-Nemotron 不仅是一次技术发布,更是 AI 行业从硬件比拼向生态共建转型的缩影。而 NVIDIA 正用开源的力量,将自身的生态影响力延伸至 AI 的每一个角落 —— 而这,或许正是未来 AI 竞争的核心逻辑。
https://www.marktechpost.com/2025/07/19/nvidia-ai-releases-openreasoning-nemotron-a-suite-of-reasoning-enhanced-llms-distilled-from-deepseek-r1-0528/