IBM 研究团队近日发布开源 AI 助手 CUGA,定位于自动化复杂的企业流程,实际表现可完成一半以上的任务。CUGA 的全称是“可配置通用代理”,通过多代理协作编排、API 接入与代码生成等能力,帮助知识工作者更高效地处理日常与复杂工作。
研究人员表示,CUGA 的目标是让用户在可控、安全、可靠的前提下,自主配置并微调代理以匹配各类业务需求。尽管外界对 AI 代理的安全性与稳定性仍有担忧,IBM 仍看好自动化在提效方面的潜力,并持续投入改进。
在 WebArena 与 AppWorld 基准上,CUGA 分别拿到 61.7% 的网页任务完成率与 48.2% 的 API 任务完成率。分数并非极限,但在当前同类技术中已属亮眼。需要注意的是,IBM 并未用其企业级测试标准 WebAgentBench 来评估 CUGA,这一点也引发了一些讨论。
与其他 AI 代理对比后可以看到进步:不少代理在类似测试中的平均完成率仅约 24.4%。IBM 团队同时指出,企业场景往往会叠加多项管理与合规要求,因此 CUGA 被设计为具备更强的政策合规与执行能力。
在架构层面,CUGA 会先解析用户意图,理解任务目标,再将其拆解为若干子任务,并根据执行情况动态调整计划。随后,它会把子任务分配给合适的专业代理处理,从而尽可能保证输出符合企业策略与规范。
此外,CUGA 可对接 Langflow 低代码平台,并支持多种开源模型的集成。在实际使用中,系统可能仍会遇到一些小问题,例如偶发无法顺利退出运行循环。对此,IBM 强调用户应对 AI 代理保持合理预期。
划重点:
🌟 CUGA 是开源 AI 助手,面向复杂企业流程自动化。
📊 基准测试网页任务完成率达 61.7%,反映 AI 代理能力正稳步提升。
🔧 支持动态任务拆解与多模型集成,有望明显提升办公效率。

















用户38505528 5个月前0
粘贴不了啊用户12648782 6个月前0
用法杂不对呢?yfarer 6个月前0
草稿id无法下载,是什么问题?