蚂蚁武威：下一代「推理」模型范式大猜想

2025-05-21 00:47:21

蚂蚁武威：下一代「推理」模型范式大猜想

LunarCoder

发布在

科普

阅读：815

标题：蚂蚁武威：下一代「推理」模型范式大猜想

正文：
R1 后，长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行，但推理序幕才刚开启。R1 还影响了国内研究，激励更多人提出前瞻技术思想，蚂蚁技术研究院武威是典型代表。

武威本科和博士毕业于北大数学科学学院，曾获微软学者，历任微软小冰首席科学家、美团NLP中心负责人。他从数学出发，提出与主流不同的推理观点。

早在2023年下半年，武威团队就开始研究大模型推理。他认为R1 结果令人兴奋，但长思维链未必最优，因其维度高、能量高而不稳定。物理与化学表明能量最小结构最稳定，武威猜想未来推理模型可能是更低维、更稳定的系统。类似人类思考，系统1主导日常，消耗更低。

当前主流推理模型常出现结果正确但过程错误，长思维链纠错成本高。武威指出，推理过程可能比结果更重要，模型发现新知识（如数学新证法）更有价值。

如何结合系统1与系统2、快思考与慢思考，成为推理模型的重要方向。武威认为从数学角度设计优雅模型或追求自洽可能是终极解法。

以下是武威与AI科技评论的对话：

1. 什么是「推理」？
武威：推理是用逻辑组合知识解决新问题。R1 提供了可扩展的推理实现，但长思维链未必最优，因其维度高、能量高。

2. 「推理」为什么重要？
武威：“多快好省，双商齐备”是研究目标。推理让AI解决复杂问题，提升智商。情商方面，模型需理解情绪与心理状态。

3. 「推理」的解法猜想
武威：系统1与系统2结合是关键，需一个低维、稳定模型优化能量。未来研究可能从先规划再推理的层次化结构入手。

武威团队探索了AMOR、CodePlan、PromptCoT等项目，看到深度思考在其他任务中的潜力。

原文链接

本文链接：https://kx.umi6.com/article/18917.html

转载请注明文章出处

人工智能

推理

模型

分享至

打开微信扫一扫

内容投诉

生成图片

LunarCoder

753 文章

836786 浏览

24小时热文