2025年被称为“agent爆发之年”。基于大语言模型(LLM)的多agent系统(MAS)因能处理复杂任务和实时互动,在软件工程、药物发现等领域广泛应用。然而,相比单agent系统,多agent系统在实际应用中更容易出错,故障率高达86.7%。
加州大学伯克利分校和意大利联合圣保罗银行的研究团队首次全面分析了多agent系统的挑战,归纳出14种独特故障模式,分为三类:规范与系统设计问题、agent间错位、任务验证与终止。该研究以《Why Do Multi-Agent LLM Systems Fail?》为题发布于arXiv。
团队提出首个基于经验的MAS故障分类法MASFT,并开发“LLM-as-a-judge”评估管道。尽管尝试了多种干预措施提升任务完成率,但仍需系统性重构。研究开源了150多个标注会话轨迹及评估工具,为后续研究奠定基础。
研究发现,多agent系统的故障模式与人类组织问题相似,强调了规范性和协调机制的重要性。团队建议采用战术和结构策略应对故障,包括优化提示、改进对话管理和引入更强的验证机制。两例研究表明,结构性调整比单一优化更具潜力。
未来,多agent系统需解决信息冗余、模型偏差等问题,提升实时协作能力,尤其在科研协作和应急响应领域有广阔前景。
原文链接
本文链接:https://kx.umi6.com/article/16283.html
转载请注明文章出处
相关推荐
换一换
OpenAI更强系统来了,通用人工智能真的触手可及吗?
2025-01-07 12:01:35
ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜
2024-06-02 00:33:31
GPT-4欺骗人类高达99.16%惊人率,PNAS重磅研究曝出,LLM推理越强欺骗值越高
2024-06-11 08:39:03
AI「长脑子」了?LLM惊现「人类脑叶」结构并有数学代码分区,MIT大牛新作震惊学界!
2024-10-30 16:13:15
Nature:「人类亲吻难题」难倒 LLM,所有大模型全部失败
2024-11-16 19:35:47
LLM时代,FPGA跑AI会比GPU更强吗?
2024-06-12 08:46:33
LeCun 与 OpenAI 阿尔特曼达成共识:承认 AGI 5 到 10 年降临,但 LLM 注定死路一条
2024-11-29 14:59:53
LeCun被痛批:烧掉千亿算力,把Meta搞砸了
2025-04-20 09:06:21
世界模型又近了?MIT惊人研究:LLM已模拟现实世界,绝非随机鹦鹉!
2024-08-19 12:33:58
Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据
2024-06-15 13:49:34
拜拜了GUI!中科院团队“LLM友好”计算机使用接口来了
2025-10-27 15:06:03
15亿流量,为何没带来AI游戏的『王者荣耀 』
2024-10-30 14:08:48
Claude 团队打开大模型“脑回路”,推出开源 LLM 思维可视化工具
2025-05-31 23:12:07
563 文章
308458 浏览
24小时热文
更多
-
2025-12-08 17:39:25 -
2025-12-08 17:37:43 -
2025-12-08 16:38:29