1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

6月6日,苹果机器学习研究中心发布论文指出,现有AI大模型更像是在记忆而非真正推理。研究评估了OpenAI、DeepSeek、Anthropic及谷歌的前沿推理模型,发现虽能在中等复杂任务中表现良好,但在高复杂度任务中性能急剧下降至零准确率。研究显示,随着问题难度增加,模型用于‘思考’的token数量反而减少,表明现有推理方法存在根本性局限。研究人员通过可控解谜环境分析模型内部推理轨迹,将任务分为低、中、高复杂度三个阶段,发现两类模型在高复杂度任务中均失效。此研究质疑了当前基于数学基准的评估方式,强调需更细致的实验设计以深入理解模型能力与局限,为未来研究提供方向。

原文链接
本文链接:https://kx.umi6.com/article/19884.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
DeepSeek们越来越聪明,却也越来越不听话了
2025-05-20 22:46:53
美的副总裁王建国:未来三年计划投入 500 亿元以上布局 AI 大模型
2025-07-09 12:03:02
DeepSeek-R1-0528 更新官方详解:思考更深、推理更强,整体表现接近 o3
2025-05-29 20:40:27
Meta可能在明年初推出新AI大模型Avocado
2025-12-09 22:02:45
GRPO在《时空谜题》中击败o1、o3-mini和R1
2025-03-27 16:59:27
AI大模型引爆银发经济:12万亿市场重构进行时
2025-03-21 11:19:20
AI 大模型创业,悄悄盯上年轻人最爱的「谷子经济」
2025-03-27 10:43:54
2025年,AI大模型打响「生态战」
2025-04-22 14:19:14
消息称 DeepSeek V3.2、智谱 GLM4.6 等 AI 大模型即将发布
2025-09-29 18:12:41
火山引擎:豆包大模型日均 Tokens 调用量已突破 30 万亿
2025-10-16 16:57:47
当虹科技发布BlackEye 2.0 多模态空间大模型 与阿里云合作打造自主可控AI大模型解决方案
2025-09-19 17:21:37
卡内基梅隆大学新研究:部分 AI 正在学着变得“越来越自私”
2025-11-01 17:39:35
Nature封面文章: DeepSeek-R1通过强化学习激励的LLM推理
2025-09-18 08:48:39
24小时热文
更多
扫一扫体验小程序