10B 级“小钢炮”:阶跃星辰开源 Step3-VL-10B,小体量对标200B 大模型

阶跃星辰近日对外开放其最新多模态视觉语言模型Step3-VL-10B。该模型仅用10B 参数量,在多项基准测评中展现出越级表现,切中了“小参数模型难以兼顾高智能”的行业痛点。

image.png

在核心评测中,Step3-VL-10B不仅在视觉理解、逻辑推理与竞赛数学等方面达到同规模 SOTA 水平,还能与体量大10至20倍的开源模型(如 Qwen3-VL-Thinking235B 等)及顶级闭源旗舰比肩甚至超越。依托全参数端到端的多模态联合预训练与大规模强化学习迭代,该模型在 AIME 等高难度数学竞赛上已跻身世界第一梯队。

此次开源提供 Base 与 Thinking 两个版本。受益于创新的并行协调推理机制(PaCoRe),模型在高精度 OCR、复杂计数与空间拓扑理解等任务中表现更稳健。这意味着原本依赖云端的复杂多模态推理,如今可更低成本部署到手机、电脑等端侧设备,大幅提升端侧 Agent 的交互效率。

  • 项目主页:https://stepfun-ai.github.io/Step3-VL-10B/

  • 论文链接:https://arxiv.org/abs/2601.09668

  • HuggingFace:https://huggingface.co/collections/stepfun-ai/step3-vl-10b

  • ModelScope:https://modelscope.cn/collections/stepfun-ai/Step3-VL-10B

划重点:

  • 🚀 小体量越级反击:Step3-VL-10B以10B 规模对标并超越200B 级巨型模型,实现了性能与规模的极致杠杆效应。

  • 🧠 深度理解与感知:融合 PaCoRe 机制与大规模强化学习,在竞赛级数学、复杂 GUI 感知及 3D 空间推理等领域达到世界顶尖水准。

  • 📱 端侧能力落地:让高性能多模态在低算力设备也能运行,为手机与工业嵌入式设备的“主动理解与交互”提供坚实底座。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞13 分享