苹果最新研究：现有 AI 大模型“更像是在记忆，而非真正的推理”

2025-06-08 17:10:55

新智燎原

发布在

快讯

阅读：980

6月6日，苹果机器学习研究中心发布论文指出，现有AI大模型更像是在记忆而非真正推理。研究评估了OpenAI、DeepSeek、Anthropic及谷歌的前沿推理模型，发现虽能在中等复杂任务中表现良好，但在高复杂度任务中性能急剧下降至零准确率。研究显示，随着问题难度增加，模型用于‘思考’的token数量反而减少，表明现有推理方法存在根本性局限。研究人员通过可控解谜环境分析模型内部推理轨迹，将任务分为低、中、高复杂度三个阶段，发现两类模型在高复杂度任务中均失效。此研究质疑了当前基于数学基准的评估方式，强调需更细致的实验设计以深入理解模型能力与局限，为未来研究提供方向。

原文链接

本文链接：https://kx.umi6.com/article/19884.html

转载请注明文章出处

AI大模型