万亿参数新旗舰!DeepSeek V4 细节流出:百万上下文 + 原生多模态

随着发布临近,国产 AI 领跑者 DeepSeek V4 的更多技术信息逐步浮现。知名爆料者 Legit 称,DeepSeek 已启动代号为「sealion-lite(海狮轻量版)」的 V4 预览版小范围封测,参与测试的机构均签订了严格的保密协议。

对比当前的 V3,DeepSeek V4 将带来跨代升级。新模型不仅原生具备多模态处理能力,还把上下文窗口直接提升到 100 万 token。这意味着它可以一次性“吃下”多本书或超长代码库,并进行深入的逻辑推理。早期测试反馈显示,V4 在生成复杂 SVG 矢量图等高难度任务上表现亮眼,明显优于目前网页端与 App 端的在线模型。

有消息称,DeepSeek V4 预计将是一款万亿参数级的大型基础模型。正因模型规模大幅增长导致训练周期延长,其正式发布时间较原计划有所推迟。值得注意的是,DeepSeek 在发布前打破行业惯例,并未向英伟达、AMD 等美系芯片商提供预览,而是提前数周向包括华为在内的中国芯片供应商开放访问,以确保模型在国产算力平台上进行深度适配与优化。

同时,DeepSeek 的 GitHub 仓库近期也出现了密集更新。尽管多为工程师节后的例行代码整理,但也加入了不少与 API 集成相关的企业级方案。随着“下周发布”的传闻持续发酵,全球开发者正屏息以待,期待这家以“高性价比、高性能”著称的中国公司,凭借 DeepSeek V4 再次冲击全球 AI 竞争格局。

概要:

  • 🚀 参数规模跨越:DeepSeek V4 面向万亿参数级模型,支持百万级长文本输入,原生多模态将带来更强的逻辑推理与内容创作能力。

  • 🇨🇳 国产算力优先:公司优先适配华为等中国芯片供应商,力求降低对外部供应链的依赖,并围绕国产硬件做深度性能调优。

  • 🗓️ 发布进入倒计时:轻量版内测已低调开启,外界预测最快将于下周官宣,这一动向正引发全球 AI 社区与资本市场的高度关注。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享