苹果公司在近日的一项研究中发现,当前20多个最先进的AI模型在处理包含干扰信息的简单算术问题时表现欠佳。在测试中,AI模型被要求解答一个关于采摘猕猴桃的问题,即“Oliver三天内采摘了多少个猕猴桃”,正确答案为190个,但大多数模型给出的答案是185个,未能排除干扰项。研究指出,这些模型主要依赖于训练数据的语言模式,而非真正理解数学概念,难以进行真正的逻辑推理。该研究揭示了AI模型在面对复杂情境下的局限性,强调了理性评估AI能力的重要性。苹果团队表示,简单增加数据量或计算能力无法从根本上解决问题。此项研究发表于11月1日,引发广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/8228.html
转载请注明文章出处
相关推荐
换一换
苹果最新 AI 研究:使其理解手机系统及 App 各种操作的后果,避免执行未经授权的高风险行为
2025-06-28 00:14:26
苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
2024-11-05 14:11:24
OpenAI 宣布 ChatGPT 新功能上线:让 AI 理解并使用公司内部“知识”,新增跨平台信息整合与安全控制功能
2025-10-24 21:54:02
95后小伙手搓AI眼镜:盲道、红绿灯都可认出 成本仅百元
2025-10-24 12:39:22
值得买科技发布2025年三季报:在稳健发展中孕育增长新动能,“AI相关收入”首度披露
2025-10-24 12:37:00
阿里回应“C计划”爆料 夸克上线对话助手挑战豆包 AI App下一步如何进化?
2025-10-23 14:06:33
Reddit 起诉 Perplexity,指控后者未经授权为 AI 抓取和使用数据
2025-10-23 16:09:59
SEMI:预计2025年全球半导体销售额超7000亿美元 2030年目标突破1万亿美元
2025-10-24 17:47:14
诺基亚CEO:目前仍处于AI超级周期的早期阶段,就像90年代的互联网
2025-10-23 20:15:12
阿里国际AI翻译模型Marco霸榜WMT机器翻译大赛最难赛道,拿下六项冠军
2025-10-23 15:07:52
硅谷投资人评估AI泡沫的5项指标
2025-10-24 10:31:18
硅谷又现AI算力巨额订单!谷歌与Anthropic达成数百亿美元合作
2025-10-24 08:29:28
顶会直聘!大厂ICCV现场玩出新模式,还是鹅会玩
2025-10-23 16:08:51
553 文章
257235 浏览
24小时热文
更多
-
2025-10-24 22:57:14 -
2025-10-24 21:54:02 -
2025-10-24 21:53:50