编程与GUI能力全面升级！Qwen3.7-Plus亮相，11小时自主闭环打造真实APP-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

阿里巴巴正式推出了全新的多模态大模型 Qwen3.7-Plus。这款模型继承了 Qwen3.7 出色的文本能力，并进一步增强了视觉与语言协同能力，将两者整合为统一的一体化智能体底座。作为一款多模态交互混合智能体，Qwen3.7-Plus 可顺畅结合 GUI（图形用户界面）和 CLI（命令行界面）交互，真正打通了从前端原型设计到复杂软件工程的端到端自动化流程。

在权威视觉模型排行榜 Vision Arena 上，依靠 Qwen3.7-Plus 的出色发挥，阿里已经进入全球前五、中国第一。

核心技术能力与评测成绩

Qwen3.7-Plus 的关键亮点，在于把“看、想、写、做、验”整合进统一闭环，在三大方向上展现出领先实力：

纯文本与推理 Agent: 在 Terminal Bench2.0、SWE-bench、SciCode 等复杂软件工程和科学编程任务中表现突出；在 GPQA Diamond 等高难度 STEM 推理基准测试中，也位居 Plus 级模型前列。
多模态推理与视觉编程: 拥有较强的空间建模和路径搜索能力（例如在 BabyVision 上带来了明显提升）。同时，还支持把图像、视频、UI 截图快速转换成可执行代码（如 SVG 还原和交互式网页设计）。
真实世界感知与视频理解: 覆盖文档解析、高阶 OCR、长短视频事件流理解，并在 LingoQA 等驾驶场景评测中体现出对动态空间关系的准确理解能力。

突破性的真实应用场景

在发布会上，官方还同步展示了多个基于 Qwen3.7-Plus 打造的前沿智能体系统：

APP 全流程自主开发: 在测试过程中，Hybrid-Agent 系统连续稳定运行11+小时，累计触发调用超过1000次，自主生成超过10,000行代码，在没有人工干预的情况下，完整完成了从需求文档到测试、部署的英语单词学习 APP 开发闭环。
桌面应用高还原复刻: 智能体通过自主操作 macOS 原生“股市”应用并理解其界面布局，自动生成 SwiftUI 源代码并接入真实行情 API，最终顺利通过10项功能验证测试，高度还原了原生暗色主题和交互体验。
云控制台无人值守运维: 基于 Qwen3.7-Plus 打造的“Qwen for Chrome”浏览器插件，可以理解非专业用户的自然语言指令，自主进入阿里云控制台完成 ECS 服务器比价、选型、配置和购买，甚至还能独立处理停机扩容等复杂运维升级任务。

目前，Qwen3.7-Plus 已经正式通过阿里云百炼及Qwen Studio对外开放服务。不论是借助 Claude Code、OpenClaw，还是 Qwen Code 等框架进行部署，该模型都能保持稳定的跨框架泛化能力，为下一代 embodied（具身）场景和生产力工作流自动化提供坚实支撑。