周鸿祎解读 DeepSeek 更新

据报告显示,此次 DeepSeek-R1 模型的小版本更新,使得 DeepSeek 重回全球 AI 排名的第二名,全球开源模型的第一名。

周鸿祎表示:“DeepSeek 目前和美国的顶尖大模型团队平起平坐,堪称我们在人工智能领域的一次重大突破,中美的 AI 实力也已势均力敌、平起平坐。”

周鸿祎还称:“DeepSeek 在关键时候,补齐了国内开发智能体在大模型需要的三大核心能力。”

分别是智能体所需要的推力规划能力;调用工具的能力;编程能力和生成页面的能力。

在推理方面,更新后的 DeepSeek-R1 取得了国内所有模型中最优的成绩,在整体表现上和其他国外顶尖水平相差不多。

如在标准的数学测试中,模型的准确率从 70%飙升至 88%,思考的程度也直接翻倍。

在调用工具的能力方面,更新后的 DeepSeek-R1 新增了函数调用和 JSON 输出格式的支持,评测成绩和 OpenAI o1 差不多,拓展了更多的可能性,如自动生成代码,自动生成界面,自动调用浏览器。

在编程能力和生成页面的能力方面,周鸿祎认为更新后的 DeepSeek-R1 性能可媲美 OpenAI o3、Claude ,已经达到世界一流水平。

周鸿祎表示:“目前这还只是 DeepSeek 小版本的更新,非常期待下次R2版本的更新内容。”