编程与GUI能力全面升级!Qwen3.7-Plus亮相,11小时自主闭环打造真实APP

 阿里巴巴正式推出了全新的多模态大模型 Qwen3.7-Plus。这款模型继承了 Qwen3.7 出色的文本能力,并进一步增强了视觉与语言协同能力,将两者整合为统一的一体化智能体底座。作为一款多模态交互混合智能体,Qwen3.7-Plus 可顺畅结合 GUI(图形用户界面)和 CLI(命令行界面)交互,真正打通了从前端原型设计到复杂软件工程的端到端自动化流程。

QQ20260602-091627.jpg

权威视觉模型排行榜 Vision Arena 上,依靠 Qwen3.7-Plus 的出色发挥,阿里已经进入全球前五、中国第一

核心技术能力与评测成绩

Qwen3.7-Plus 的关键亮点,在于把“看、想、写、做、验”整合进统一闭环,在三大方向上展现出领先实力:

  • 纯文本与推理 Agent: 在 Terminal Bench2.0、SWE-bench、SciCode 等复杂软件工程和科学编程任务中表现突出;在 GPQA Diamond 等高难度 STEM 推理基准测试中,也位居 Plus 级模型前列。

  • 多模态推理与视觉编程: 拥有较强的空间建模和路径搜索能力(例如在 BabyVision 上带来了明显提升)。同时,还支持把图像、视频、UI 截图快速转换成可执行代码(如 SVG 还原和交互式网页设计)。

  • 真实世界感知与视频理解: 覆盖文档解析、高阶 OCR、长短视频事件流理解,并在 LingoQA 等驾驶场景评测中体现出对动态空间关系的准确理解能力。

QQ20260602-091701.jpg

突破性的真实应用场景

在发布会上,官方还同步展示了多个基于 Qwen3.7-Plus 打造的前沿智能体系统:

  1. APP 全流程自主开发: 在测试过程中,Hybrid-Agent 系统连续稳定运行11+小时,累计触发调用超过1000次,自主生成超过10,000行代码,在没有人工干预的情况下,完整完成了从需求文档到测试、部署的英语单词学习 APP 开发闭环。

  2. 桌面应用高还原复刻: 智能体通过自主操作 macOS 原生“股市”应用并理解其界面布局,自动生成 SwiftUI 源代码并接入真实行情 API,最终顺利通过10项功能验证测试,高度还原了原生暗色主题和交互体验。

  3. 云控制台无人值守运维: 基于 Qwen3.7-Plus 打造的“Qwen for Chrome”浏览器插件,可以理解非专业用户的自然语言指令,自主进入阿里云控制台完成 ECS 服务器比价、选型、配置和购买,甚至还能独立处理停机扩容等复杂运维升级任务。

目前,Qwen3.7-Plus 已经正式通过阿里云百炼Qwen Studio对外开放服务。不论是借助 Claude Code、OpenClaw,还是 Qwen Code 等框架进行部署,该模型都能保持稳定的跨框架泛化能力,为下一代 embodied(具身)场景和生产力工作流自动化提供坚实支撑。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享