DeepSeek V3.1 支持了 UE8M0 FP8

深度求索宣布正式发布DeepSeek-V3.1。其中一个重大的进步和惊喜,就是支持了 UE8M0 FP8 。

DeepSeek在其官宣发布 DeepSeek-V3.1 的文章中提到, UE8M0 FP8 是针对即将发布的下一代国产芯片设计。

东莞证券指出,该格式通过更高的灵活度支持复杂模型推理,提升芯片的解码效率与运算能力,为国产芯片适配更大模型提供技术路径,国产 AI 算力生态有望加速成型。

那 UE8M0 FP8 到底是什么?将有何影响?

人工智能领域的企业家与技术专家、清华大学计算机系人工智能所博士梁斌表示, DeepSeek 这次为什么非要强调 UE8M0 FP8 呢?这个和英伟达的 FP8 是两个东西,两套标准。

他解释称,显存的发展是有限的,而模型的发展是快速的,对每个参数的表达必须通过量化进行压缩, FP32 就是 32 位表达一个参数, FP8 就是 8 位表达一个参数,在可接受的范围内,肯定是越低的表达,在显存里面能装下更多的参数。

FP8 有英伟达的 E4M3/E5M2 方案和 DS 的这个 UE8M0 方案,主要区别就是前者有 3-2 位的小数表达,后者没有小数表达。前者精度好,后者功耗低,运算快,对芯片要求低。

梁斌表示,现在 DeepSeek 支持 UE8M0 FP8 ,加上国产芯片都向这个标准靠拢,这是彻底和英伟达决裂了,以后其他推理模型,要么选择 DS 这套体系,要么选择英伟达体系,国内芯片公司也积极向这套体系靠拢。

“现在华为他们那边真是为了适配这个标准,真是玩命干,干成了就是名垂千古,多大诱惑,而且我发现 DeepSeek 还真是有胆量,真是把国产大模型的发展推到了一个牛 X 的高度上去,太了不起了。”