据 业内媒体 报道,值此 DeepSeek-R1 发布满一周年之际,DeepSeek 下一代旗舰模型的动向正悄然显露。结合 The Information 的消息,这款备受关注的新模型(或为 DeepSeek V4)最快可能在今年2月中旬(农历新年期间)上线,预计将带来更强的代码生成表现。

有开发者在 DeepSeek 的 GitHub 仓库中发现,最新更新的 FlashMLA 代码库里,在114个文件中出现了至少28处对“MODEL1”的引用。代码逻辑显示,“MODEL1” 是一个不同于现有 “V32”(即 DeepSeek-V3.2)的全新架构。两者的主要差异集中在键值(KV)缓存的组织方式、稀疏性的处理策略,以及对 FP8 数据格式解码的支持,这暗示新模型在内存占用和计算效率上进行了有针对性的底层优化。
此前,DeepSeek 团队相继发布了关于“优化残差连接(mHC)”和受生物学启发的“AI 记忆模块(Engram)”的相关论文。业内普遍认为,这些近期研究成果很可能会被整合进正在打造的“MODEL1”,为即将到来的新旗舰提供关键技术支撑。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?