DeepSeek代码库冒出神秘代号“MODEL1”,新旗舰或将于2月发布

国产 AI 头部玩家DeepSeek近期动作不断。赶在 R1 模型上线满一周年之际,其技术走向再次引发开发者社区关注。根据最新GitHub代码提交记录显示,在DeepSeek更新的 FlashMLA 代码中,被发现存在大量指向未知模型“MODEL1”的标识。

这套覆盖上百个文件的代码库里,多处将“MODEL1”与现有的V3.2 版本并列出现,说明它并非对现有架构的小修小补,更可能是一个全新的模型序列。进一步的技术差异也在支持这一判断:新架构在键值(KV)缓存布局、稀疏性处理逻辑以及对 FP8 数据格式的解码支持上,均体现出与V3 系列不同的设计路径,这通常意味着在计算效率与显存占用方面实现了新的优化突破。

此前有传闻称,DeepSeek计划在 2026 年农历新年期间发布名为DeepSeek V4的旗舰模型,主打更强的代码编写与生成能力。结合近期官方公开的两篇重磅论文,分别聚焦“优化残差连接(mHC)”与“AI 记忆模块(Engram)”,外界普遍推测,“MODEL1”很可能是这些尖端研究成果的工程化落地。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享