DeepSeek V4 下周发布!多模态新旗舰或改写AI格局

据《科创板日报》报道,DeepSeek 计划在下周推出其最新的大模型——V4。该产品备受关注,支持生成图像、视频与文本,意味着 DeepSeek 在多模态技术上再迈出关键一步。

消息人士称,DeepSeek V4 将在硬件适配上全面支持国产算力,重点强化与中国制造芯片的兼容性。这不仅有望带动国内市场对本土半导体的需求,也将加速模型在推理阶段与国产芯片的协同。

与 V4 同步,DeepSeek 还计划发布一份简短的技术说明,并预计在一个月后推出更详尽的技术报告。这些安排体现了 DeepSeek 在技术透明与市场响应上的坚定态度。

目前,“V4 Lite” 测试版也在进行中。该版本代号为 “sealion-lite”,上下文窗口达到 100 万 tokens,相比 V3 系列的 128K 提升近 8 倍,按理论可一次性处理《三体》全集的文本量。值得一提的是,V4 Lite 采用原生多模态架构,即在预训练阶段就同时学习文本与视觉,而不是后期拼接。

从参数规模看,V4 Lite 预计约为 2000 亿参数,而完整的 V4 版本或将突破 1 万亿。此外,V4 Lite 在生成 SVG 图像方面表现亮眼,只需约 54 行的极简代码即可产出高质量图像,展现出其在空间推理和结构化输出上的进步。

回顾 DeepSeek 的演进,自 2023 年以来该公司在推理能力与模型效率上持续创新。自 2024 年发布 V2 起,团队一直追求综合性能与推理效率的平衡;到 2025 年,V3 系列不仅打下了强劲的综合实力基础,也通过不断的小版本更新提升了用户体验。

总体来看,在 V4 临近发布之际,DeepSeek 仍在技术革新与多模态布局上持续加码,预计将为 AI 领域注入新的活力与可能性。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享