据 AIbase 披露,赶在 DeepSeek-R1 发布满一周年之际,DeepSeek 下一代旗舰模型的蛛丝马迹已开始显现。结合 The Information 的相关爆料,这款备受关注的新模型(或为 DeepSeek V4)最快可能在今年2月中旬(正值农历新年)正式亮相,预计会带来更强的代码生成表现。

有开发者在 DeepSeek 的 GitHub 仓库中发现,最新更新的 FlashMLA 代码库里,跨越114个文件共出现了28处名为“MODEL1”的神秘标识。代码结构显示,“MODEL1” 与现有的 “V32”(DeepSeek-V3.2)并非同一套架构。两者的主要差别集中在键值(KV)缓存的布局、稀疏性处理策略,以及对 FP8 数据格式解码的支持。这些变化暗示新模型在内存占用和计算效率上做了更深入的底层优化。
此前,DeepSeek 团队已相继发表了关于“优化残差连接(mHC)”以及受生物学启发的“AI 记忆模块(Engram)”等技术论文。业界普遍认为,这些最新研究很可能会被整合进正在打造的“MODEL1”,为这款即将发布的旗舰模型提供核心技术支撑。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?