多智能体并非越多越好:谷歌与MIT研究给出答案

最近,谷歌研究院、Google DeepMind 与麻省理工学院联合发布了一项研究,对“智能体越多效果越好”的观念提出质疑。团队通过 180 个对照实验评估多智能体在不同任务中的表现,结果波动很大:有的任务最高提升 81%,也有任务下滑到 70%。

研究指出,任务类型是关键因素。在可并行的任务中,比如金融分析,采用集中式协调的多智能体能显著提升效率。各个智能体分别分析销售趋势、成本结构和市场数据,再把结果汇总,最终带来接近 81% 的性能提升。

但在必须按顺序推进的任务里,如 Minecraft 的规划,多智能体反而会让表现下降 39%~70%。原因在于每一步制作都会改变库存并影响下一步,强烈的顺序依赖让信息在智能体之间传递时更容易丢失或被割裂。

研究还总结了三点主要影响因素:一是任务用到的工具越多(如联网搜索、编码等),越容易被多智能体的协同成本拖慢;二是当单个智能体成功率高于 45% 时,再增加智能体往往收益递减甚至为负,协调成本会吃掉增益;三是错误在多智能体环境中累积更快,缺少信息共享时,错误扩散速度比单智能体环境快 17 倍。

划重点:

🌟 并行任务更受益,但在顺序任务中多智能体会明显降效。

🤖 单个智能体成功率超过 45% 时,上多智能体未必划算。

🔧 工具越多,协同成本越高,性能更易受影响。

爱智特-AI智能体一站式企业智能体交易学习发行平台|智能体教程|智能体社区
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享