据《白鲸实验室》独家披露,外界关注已久的 DeepSeek V4 与姚顺雨牵头的新一代混元模型计划在 2026 年 4 月正式推出。DeepSeek V4 由梁文锋负责主导,是一款多模态大模型,历经长期迭代优化,预计在代码生成与长时记忆方面会有明显提升。这一发布与 DeepSeek 团队近年的研究方向一致,尤其在视觉内容理解与智能搜索能力上更为突出。
梁文锋的研究聚焦“条件记忆”机制。他在 2026 年 1 月发布的《Conditional Memory via Scalable Lookup》中提出了相关理论;在 2025 年 12 月又发表了《mHC: Manifold-Constrained Hyper-Connections》,进一步优化底层架构。这些工作旨在解决 Transformer 在记忆与训练稳定性方面的不足。DeepSeek V4 不仅具备强大的多模态处理能力,还将深度适配国产芯片,目标是成为第一个完全依赖国产算力的核心模型。
与此同时,姚顺雨的新混元模型也计划在 4 月亮相。自 2025 年 12 月起,他担任腾讯总办首席 AI 科学家,统筹 AI Infra 与大语言模型两大部门。在 2026 年 2 月,他发布了 CL-bench,提出面向“上下文学习”的新评测基准,强调长上下文能力与 Agent 可用性的重要性。据悉,姚顺雨团队的新模型规模约为 30 亿参数,并从一开始就更注重实际落地,而非单纯比拼参数规模。
这两款产品的即将发布不仅引发市场关注,也被视为中国人工智能加速发展的缩影。无论是 DeepSeek V4 的长时记忆突破,还是腾讯混元在真实任务评测上的推进,核心目标都是回答“大模型如何更好服务生产环境”的问题。

















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?