多智能体并非一定更高效:谷歌与麻省理工联合研究给出答案

最近,Google Research、DeepMind 与麻省理工学院发布一项联合研究,直指“智能体越多越好”的常识并不总成立。团队通过 180 项对照实验评估多智能体在不同任务上的表现,结果波动明显:有的场景最高提升约 81%,也有的反而下降达 70%。

研究指出,任务类型是关键因素。对可并行拆分的工作(如金融分析),采用集中式协调的多智能体能显著提效:不同智能体分别处理销售趋势、成本结构、市场数据等模块,独立产出后再统一汇总,整体表现可接近提升 81%。

但在强顺序依赖的任务中(例如 Minecraft 的规划/制作流程),多智能体反而可能拖累,性能下滑 39%—70%。原因在于每一步都会改变后续所需的库存与状态,跨智能体传递时信息容易被切割或遗漏,顺序依赖被打断,导致效率下降。

研究还总结出三点主要影响因素:其一,涉及的工具越多(如需要联网搜索或编码),多智能体越容易被工具切换与接口差异带来的开销所影响;其二,当单智能体成功率已超过 45% 时,再增加智能体常出现收益递减,甚至转为负收益,协调成本会抵消增益;其三,错误在多智能体环境中更易加速累积,若信息共享不足,错误传播速度比单智能体场景快约 17 倍。

划重点:

🌟 并行可拆任务更适合多智能体;强顺序任务可能明显变慢。

🤖 当单智能体成功率高于 45% 时,再加智能体常常不划算。

🔧 工具越多、链路越复杂,协调成本越高,整体性能越易受影响。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享