首页    新闻    小组    威客    人才    下载    博客    代码贴    在线编程    论坛
DeepSeek 透露下一代国产芯片即将发布
2025年8月21日 18:22 | 阅读 297 次
深度求索官方今日正式对外发布 DeepSeek-V3.1,官方提到 DeepSeek-V3.1 使用了 UE8M0 FP8 Scale 的参数精度。

在 DeepSeek 官方公众号文章页面,DeepSeek 进一步解释称:UE8M0 FP8 是针对即将发布的下一代国产芯片设计

FP 英文全称为 Floating Point,是 IEEE 定义的标准浮点数类型。UE8M0 FP8 在 AI 模型领域代表一种模型精度。

DeepSeek V3.1 的 Base 模型在 V3 的基础上重新做了外扩训练,一共增加训练了 840B tokens。Base 模型与后训练模型均已在 Huggingface 与魔搭开源。

Base 模型:

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base

后训练模型:

  • Hugging Face:https://huggingface.co/deepseek-ai/DeepSeek-V3.1

  • 魔搭:https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1

(文/开源中国)    




评论 (0)
游客请输入验证码
最新评论
1
0
收藏