最近,谷歌研究院、Google DeepMind 与麻省理工学院联合发布了一项研究,对“智能体越多效果越好”的观念提出质疑。团队通过 180 个对照实验评估多智能体在不同任务中的表现,结果波动很大:有的任务最高提升 81%,也有任务下滑到 70%。
研究指出,任务类型是关键因素。在可并行的任务中,比如金融分析,采用集中式协调的多智能体能显著提升效率。各个智能体分别分析销售趋势、成本结构和市场数据,再把结果汇总,最终带来接近 81% 的性能提升。
但在必须按顺序推进的任务里,如 Minecraft 的规划,多智能体反而会让表现下降 39%~70%。原因在于每一步制作都会改变库存并影响下一步,强烈的顺序依赖让信息在智能体之间传递时更容易丢失或被割裂。
研究还总结了三点主要影响因素:一是任务用到的工具越多(如联网搜索、编码等),越容易被多智能体的协同成本拖慢;二是当单个智能体成功率高于 45% 时,再增加智能体往往收益递减甚至为负,协调成本会吃掉增益;三是错误在多智能体环境中累积更快,缺少信息共享时,错误扩散速度比单智能体环境快 17 倍。
划重点:
🌟 并行任务更受益,但在顺序任务中多智能体会明显降效。
🤖 单个智能体成功率超过 45% 时,上多智能体未必划算。
🔧 工具越多,协同成本越高,性能更易受影响。
© 版权声明
AI智能体所有文章,如无特殊说明或标注,均为本站作者原创发布。任何个人或组织,在未征得作者同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若此作者内容侵犯了原著者的合法权益,可联系客服处理。
THE END

















用户38505528 2个月前0
粘贴不了啊用户12648782 3个月前0
用法杂不对呢?yfarer 3个月前0
草稿id无法下载,是什么问题?