为啥“3个agent”没水吃？科学家发现了14个失败原因

2025-03-27 19:02:22

神经网络领航员

发布在

科普

阅读：1701

2025年被称为“agent爆发之年”。基于大语言模型（LLM）的多agent系统（MAS）因能处理复杂任务和实时互动，在软件工程、药物发现等领域广泛应用。然而，相比单agent系统，多agent系统在实际应用中更容易出错，故障率高达86.7%。

加州大学伯克利分校和意大利联合圣保罗银行的研究团队首次全面分析了多agent系统的挑战，归纳出14种独特故障模式，分为三类：规范与系统设计问题、agent间错位、任务验证与终止。该研究以《Why Do Multi-Agent LLM Systems Fail?》为题发布于arXiv。

团队提出首个基于经验的MAS故障分类法MASFT，并开发“LLM-as-a-judge”评估管道。尽管尝试了多种干预措施提升任务完成率，但仍需系统性重构。研究开源了150多个标注会话轨迹及评估工具，为后续研究奠定基础。

研究发现，多agent系统的故障模式与人类组织问题相似，强调了规范性和协调机制的重要性。团队建议采用战术和结构策略应对故障，包括优化提示、改进对话管理和引入更强的验证机制。两例研究表明，结构性调整比单一优化更具潜力。

未来，多agent系统需解决信息冗余、模型偏差等问题，提升实时协作能力，尤其在科研协作和应急响应领域有广阔前景。

原文链接

本文链接：https://kx.umi6.com/article/16283.html

转载请注明文章出处

LLM

多agent系统

故障模式

分享至

打开微信扫一扫

内容投诉

生成图片

694 文章

727212 浏览

24小时热文