顶级 AI 智能体不会社交、创业远不如人类：卡内基梅隆大学等称其最多完成 24% 任务

2025-01-26 17:17:03

DreamCoder

发布在

快讯

阅读：622

卡内基梅隆大学等机构的研究显示，当前最先进的AI智能体在自主运营软件公司方面表现不佳。实验中，基于大模型的智能体需完成软件开发、项目管理和财务分析等任务，但表现最好的智能体仅能完成24%的任务，得分34.4%。开源模型Llama3.1与闭源模型GPT-4o表现相近。智能体存在的主要问题包括缺乏常识、社交技巧不足、浏览网页易出错和自欺欺人。尽管如此，研究者认为未来通过改进训练和灌输更多常识，AI有望更好地完成复杂任务，实现更多岗位的自动化。详情见论文：

原文链接

本文链接：https://kx.umi6.com/article/12207.html

转载请注明文章出处

大模型