LLM多Agent系统：协作、失败归因与自进化¶

tags: #Multi-Agent #Collaboration #Failure-Attribution #Self-Evolution #Survey source: Survey Paper | arXiv score: 技术深度8/10 | 实用价值7/10 | 时效性9/10 | 领域匹配8/10 | 综合 8.0/10

核心概念¶

这是一篇关于LLM多Agent系统的综合survey，聚焦三个被低估的关键问题：协作效率（多个Agent如何有效分工）、失败归因（任务失败时如何定位是哪个Agent的责任）、自进化（系统如何从失败中学习改进）。大多数多Agent研究只关注"能不能完成"，而这篇论文关注"失败后怎么办"。

设计原理¶

三大问题域的关系： 1. 协作（Collaboration）：如何分配任务、共享信息、避免冲突。核心挑战是"信息不对称"——每个Agent只能看到自己的视角 2. 失败归因（Failure Attribution）：当多Agent协作失败时，如何确定是哪个环节出了问题。这比单Agent debugging复杂一个数量级，因为存在"级联失败"（Agent A的错误传给B，B传给C） 3. 自进化（Self-Evolution）：基于失败归因结果，系统如何自动改进。关键是从"全局失败信号"反推出"局部改进方案"

为什么失败归因是核心： - 单Agent系统：失败原因只有"模型不够好"或"prompt不够好" - 多Agent系统：失败可能是任务分配不当、信息传递丢失、Agent间冲突、任何单一Agent的错误 - 没有有效的失败归因，自进化就无从谈起——你不知道该改进什么

关键实现¶

Survey覆盖了近期多Agent系统的主流框架和方法
提出失败归因的分类框架：通信层归因 vs 决策层归因 vs 执行层归因
自进化策略分类：参数级（微调）vs Prompt级（模板优化）vs 架构级（Agent拓扑调整）
论文编号：arXiv 2605.14892

关联分析¶

与 Agent-Control-Flow 关联：多Agent系统的控制流比单Agent复杂得多，需要专门的协调机制
与 WildClawBench 互补：长周期任务失败时，多Agent场景的归因难度更高
与 AI-Agent-Self-Improving 直接相关：自进化是多Agent系统的终极目标

可执行建议¶

多Agent项目设计：在架构设计阶段就考虑失败归因——每个Agent的输入/输出要可追溯
日志先行：多Agent系统上线前先建好全链路日志，否则出问题时根本无法debug
从单Agent开始：不要过早引入多Agent架构，单Agent能解决的问题不需要多Agent的复杂性
移动端启示：移动App的多进程/多组件协作与多Agent面临类似的归因问题，可以借鉴Android的崩溃上报和链路追踪思路

自评¶

维度	分数	权重	加权
摘要质量	8	0.25	2.00
技术深度	8	0.25	2.00
相关性	8	0.20	1.60
原创性	7	0.15	1.05
格式规范	8	0.15	1.20
加权总分			7.85