这是一款面向智能体场景打造的模型,Step3.5Flash采用稀疏MoE架构,总参数达到1960亿;通过优化,仅在推理阶段激活约110亿参数,带来极高的能效比。在单次代码请求任务中,其推理速度最高可达350TPS。依托出色的复杂推理能力和长链任务处理水平,该模型在推理深度上已经具备挑战顶级闭源模型的实力。

当下,Step3.5Flash在开源社区十分活跃,其在Hugging Face的下载量已超过30万次,并位居OpenRouter Trending榜首。在被称为“小龙虾”的知名开源项目OpenClaw中,凭借在速度、稳定性及Agent适配性方面的明显优势,该模型的调用量已跃升至全球前二。
这次全链路开源不但让开源大模型生态更丰富,也为开发者打造高性能Agent提供了更灵活、透明的底层支持,标志着国产大模型在平衡模型性能与推理成本方面取得了重要突破。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END


















用户38505528 6个月前0
粘贴不了啊用户12648782 7个月前0
用法杂不对呢?yfarer 7个月前0
草稿id无法下载,是什么问题?