10B 级“小钢炮”：阶跃星辰开源 Step3-VL-10B，小体量对标200B 大模型-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

10B 级“小钢炮”：阶跃星辰开源 Step3-VL-10B，小体量对标200B 大模型

拥抱AI，AIGC最佳实践者

7413

阶跃星辰近日对外开放其最新多模态视觉语言模型Step3-VL-10B。该模型仅用10B 参数量，在多项基准测评中展现出越级表现，切中了“小参数模型难以兼顾高智能”的行业痛点。

在核心评测中，Step3-VL-10B不仅在视觉理解、逻辑推理与竞赛数学等方面达到同规模 SOTA 水平，还能与体量大10至20倍的开源模型（如 Qwen3-VL-Thinking235B 等）及顶级闭源旗舰比肩甚至超越。依托全参数端到端的多模态联合预训练与大规模强化学习迭代，该模型在 AIME 等高难度数学竞赛上已跻身世界第一梯队。

此次开源提供 Base 与 Thinking 两个版本。受益于创新的并行协调推理机制（PaCoRe），模型在高精度 OCR、复杂计数与空间拓扑理解等任务中表现更稳健。这意味着原本依赖云端的复杂多模态推理，如今可更低成本部署到手机、电脑等端侧设备，大幅提升端侧 Agent 的交互效率。

项目主页:https://stepfun-ai.github.io/Step3-VL-10B/
论文链接:https://arxiv.org/abs/2601.09668
HuggingFace:https://huggingface.co/collections/stepfun-ai/step3-vl-10b
ModelScope:https://modelscope.cn/collections/stepfun-ai/Step3-VL-10B

划重点:

🚀 小体量越级反击:Step3-VL-10B以10B 规模对标并超越200B 级巨型模型，实现了性能与规模的极致杠杆效应。
🧠 深度理解与感知:融合 PaCoRe 机制与大规模强化学习，在竞赛级数学、复杂 GUI 感知及 3D 空间推理等领域达到世界顶尖水准。
📱 端侧能力落地:让高性能多模态在低算力设备也能运行，为手机与工业嵌入式设备的“主动理解与交互”提供坚实底座。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区

© 版权声明

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

喜欢就支持一下吧

相关推荐