现有模型局限性

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

苹果最新研究：现有 AI 大模型“更像是在记忆，而非真正的推理”

6月6日，苹果机器学习研究中心发布论文指出，现有AI大模型更像是在记忆而非真正推理。研究评估了OpenAI、DeepSeek、Anthropic及谷歌的前沿推理模型，发现虽能在中等复杂任务中表现良好，但在高复杂度任务中性能急剧下降至零准确率。研究显示，随着问题难度增加，模型用于‘思考’的token数量反而减少，表明现有推理方法存在根本性局限。研究人员通过可控解谜环境分析模型内部推理轨迹，将任务分为低、中、高复杂度三个阶段，发现两类模型在高复杂度任务中均失效。此研究质疑了当前基于数学基准的评估方式，强调需更细致的实验设计以深入理解模型能力与局限，为未来研究提供方向。

原文链接