阶跃星辰推出 Step 3.5 Flash:面向 Agent 的开源“轻骑兵”

阶跃星辰(Stepfun)近日正式发布了其全新一代开源基座模型——Step3.5Flash。这款模型专为智能体(Agent)场景打造,凭借强劲的推理能力与极速响应,旨在为开发者提供一个更聪明、更稳定、且成本可控的“Agent 大脑”。

image.png

作为一款高度聚焦的轻量模型,Step3.5Flash 在多个方面带来突破:

  • 极快速度: 推理速度峰值可达 350 TPS(每秒生成的词数),在代码相关任务中表现格外亮眼。

  • 性能比肩闭源: 在 Agent 核心应用场景与数学逻辑任务中,表现可与主流闭源大模型相媲美。

  • 长链条任务保障: 稳定支持复杂的长逻辑链任务,可高效处理 256K 的超长上下文。

技术架构:效率与深度兼顾

Step3.5Flash 采用先进的稀疏 MoE(混合专家)架构,总参数量达 1960 亿,但每个 Token 实际激活约 110 亿参数。为进一步提升效率,模型加入 MTP-3 技术,可一次预测 3 个 Token,整体吞吐显著提升。此外,借助滑动窗口与全局注意力的混合方案,模型能精准抓取长文本中的关键点,显著降低计算负担。

多场景实测:从编程到端云协同

在真实应用展示中,Step3.5Flash 能力多面:

  • 智能编程: 仅凭一段文字描述,即可自动生成并输出基于 WebGL2.0 引擎的高性能可视化平台。

  • 复杂计算: 在无需外部工具的情况下,快速完成等差数列求和、阶乘累加等较难的数学运算。

  • 端云协同: 作为“云端大脑”,可将用户模糊需求(如对比各平台价格)拆解为明确的搜索与抓取子任务,极大简化本地执行端的复杂度,并保证结果更可靠。

目前,Step3.5Flash 已在多个主流平台全量上线,包括 GitHub、HuggingFace 与 OpenRouter。为降低本地部署门槛,阶跃星辰还针对个人工作站(如 NVIDIA DGX、Apple M4 Max 等)进行了性能优化。同时,公司已启动 Step4 模型的训练,邀请全球开发者共同参与,定义下一代 Agent 基础模型。

  • OpenRouter 限免中,0 成本升级你的 Agent: https://openrouter.ai/stepfun/step-3.5-flash

  • GitHub 下载快速部署,打造专属 Agent: https://github.com/stepfun-ai/Step-3.5-Flash/tree/main

  • HuggingFace 获取模型权重: https://huggingface.co/stepfun-ai/Step-3.5-Flash

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞9 分享