苹果公司在近日的一项研究中发现,当前20多个最先进的AI模型在处理包含干扰信息的简单算术问题时表现欠佳。在测试中,AI模型被要求解答一个关于采摘猕猴桃的问题,即“Oliver三天内采摘了多少个猕猴桃”,正确答案为190个,但大多数模型给出的答案是185个,未能排除干扰项。研究指出,这些模型主要依赖于训练数据的语言模式,而非真正理解数学概念,难以进行真正的逻辑推理。该研究揭示了AI模型在面对复杂情境下的局限性,强调了理性评估AI能力的重要性。苹果团队表示,简单增加数据量或计算能力无法从根本上解决问题。此项研究发表于11月1日,引发广泛关注。
原文链接
本文链接:https://kx.umi6.com/article/8228.html
转载请注明文章出处
相关推荐
换一换
苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
2024-11-05 14:11:24
苹果最新 AI 研究:使其理解手机系统及 App 各种操作的后果,避免执行未经授权的高风险行为
2025-06-28 00:14:26
谨防诈骗!OpenClaw创始人否认入驻微博等中文社交平台
2026-03-08 14:07:08
人力资源社会保障部部长:正研究措施发挥人工智能创造新岗位和赋能传统岗位作用
2026-03-07 11:27:41
华泰证券:超配电力链中上游品种 内需与AI是能源之外的主要线索
2026-03-06 20:36:01
中信证券:看好Micro LED CPO产业趋势,上游芯片环节有望深度受益
2026-03-09 09:25:49
AI浏览器何时才能安全?
2026-03-07 00:49:29
俄研究机构训练人工智能识别早期乳腺癌
2026-03-07 11:27:53
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
火山引擎上线ArkClaw:开箱即用的云上SaaS版OpenClaw
2026-03-09 15:55:48
AI短剧《霍去病》走红!导演澄清制作细节:3000元仅算力成本
2026-03-08 17:25:18
arXiv创始人亲测:水论文这一块,Grok最强,Claude最不配合
2026-03-09 13:40:43
高德发布全球首个由大模型驱动的视觉认知步行导引系统
2026-03-06 19:28:12
678 文章
468303 浏览
24小时热文
更多
-
2026-03-10 10:02:35 -
2026-03-10 09:02:22 -
2026-03-10 09:01:12