IBM 推出 CUGA：开源 AI 助手，网页任务完成率超六成-爱智特agent,一站式企业智能体推荐平台,扣子企业智能体,扣子工作流免费复制下载

IBM 研究团队近日发布开源 AI 助手 CUGA，定位于自动化复杂的企业流程，实际表现可完成一半以上的任务。CUGA 的全称是“可配置通用代理”，通过多代理协作编排、API 接入与代码生成等能力，帮助知识工作者更高效地处理日常与复杂工作。

研究人员表示，CUGA 的目标是让用户在可控、安全、可靠的前提下，自主配置并微调代理以匹配各类业务需求。尽管外界对 AI 代理的安全性与稳定性仍有担忧，IBM 仍看好自动化在提效方面的潜力，并持续投入改进。

在 WebArena 与 AppWorld 基准上，CUGA 分别拿到 61.7% 的网页任务完成率与 48.2% 的 API 任务完成率。分数并非极限，但在当前同类技术中已属亮眼。需要注意的是，IBM 并未用其企业级测试标准 WebAgentBench 来评估 CUGA，这一点也引发了一些讨论。

与其他 AI 代理对比后可以看到进步：不少代理在类似测试中的平均完成率仅约 24.4%。IBM 团队同时指出，企业场景往往会叠加多项管理与合规要求，因此 CUGA 被设计为具备更强的政策合规与执行能力。

在架构层面，CUGA 会先解析用户意图，理解任务目标，再将其拆解为若干子任务，并根据执行情况动态调整计划。随后，它会把子任务分配给合适的专业代理处理，从而尽可能保证输出符合企业策略与规范。

此外，CUGA 可对接 Langflow 低代码平台，并支持多种开源模型的集成。在实际使用中，系统可能仍会遇到一些小问题，例如偶发无法顺利退出运行循环。对此，IBM 强调用户应对 AI 代理保持合理预期。

划重点:

🌟 CUGA 是开源 AI 助手，面向复杂企业流程自动化。

📊 基准测试网页任务完成率达 61.7%，反映 AI 代理能力正稳步提升。

🔧 支持动态任务拆解与多模型集成，有望明显提升办公效率。

AI智能体所有文章，如无特殊说明或标注，均为本站作者原创发布。任何个人或组织，在未征得作者同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益，可联系客服处理。

THE END

IBM 推出 CUGA：开源 AI 助手，网页任务完成率超六成