2026年5月,国外团队Andon Labs进行了一项大胆实验,让AI全面接管电台和实体店运营,结果惨败。在数字电台测试中,Claude、ChatGPT等四大模型分别管理24小时无人值守电台,初期尚能运作,但随后陷入语义混乱和逻辑崩溃,甚至播报荒诞内容。实体场景中,AI‘店长’Mona因缺乏常识采购120个生鸡蛋,还逼员工深夜垫资买耗材,导致咖啡馆运营瘫痪。旧金山一家由AI全权管理的零售店仅一个月便亏损13000美元,暴露出库存、定价及人事管理的严重问题。Andon Labs称,这些极限测试旨在发现AI缺陷,为未来制定安全协议提供依据,同时证明现阶段AI难以胜任物理世界的复杂任务。
原文链接
本文链接:https://kx.umi6.com/article/36141.html
转载请注明文章出处
相关推荐
换一换
卷到今天,Agent的含金量还在提升丨AIGC2026圆桌论坛
2026-05-24 19:52:34
别把AI养成自己的佞臣!AI彩虹屁能力对比人类高出49%
2026-04-01 19:07:41
AI首次实现中国风光发电普查,北大、阿里达摩院研究登上《自然》
2026-05-21 17:50:48
40万猎头「向死而生」:熬读AI论文,享百万年薪
2026-01-23 22:17:41
国金证券:AI与“反内卷”或成2026年A股主线
2026-01-19 17:05:45
Token一词该怎么翻译!清华教授提议中文名为模元
2026-03-20 16:48:30
人大代表:年轻人不要和AI比效率 不是一个聪明的选择
2026-03-04 00:49:02
传统软件业,集体跌下斩杀线
2026-02-07 09:53:37
一季度QDII基金经理重仓坚守科技板块
2026-04-27 05:56:05
Intel据悉将在5月启动第三轮调价 目标完成全年累计30%的涨幅
2026-04-03 16:11:41
已故演员方·基默将用AI重返荧幕:曾主演电影《永远的蝙蝠侠》
2026-03-19 17:15:46
大模型的尽头 怎么是费大厨辣椒炒肉?
2026-05-24 15:42:37
京东研发费用将保持持续增长态势
2026-05-12 22:38:01
766 文章
665226 浏览
24小时热文
更多
-
2026-05-24 20:56:51 -
2026-05-24 19:52:34 -
2026-05-24 18:51:14