DeepSeek 新闻
DeepSeek 公布 V3 降本技术,技术报告公布
DeepSeek 公布了旗下 V3 模型在训练、推理过程中,如何解决「硬件瓶颈」和「降本」的技术报告,值得一提的是,DeepSeek 创始人梁文锋也在作者名单中。 据...
SophNet 发布 DeepSeek API 极速版
之前分享过 API 调用 Deepseek R1 满血版:Sophnet,现在新注册的用户还可以赠送 20 元额度。开发者仅需 3 分钟,即可完成大模型的接入,支持多种模型,...
DeepSeek 致谢腾讯技术团队:“巨大的加速” 代码贡献。
据新浪报道,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。 经测试,优化后的通信框架性能在RoC...
DeepSeek Prover V2 671B 新模型发布
DeepSeek 在 AI 开源社区 Hugging Face 发布了一个名为 DeepSeek-Prover-V2-671B 的新模型。DeepSeek-Prover-V2-671B 使用了更高效的 safetensors 文件格式,...