标题:蚂蚁武威:下一代「推理」模型范式大猜想
正文:
R1 后,长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行,但推理序幕才刚开启。R1 还影响了国内研究,激励更多人提出前瞻技术思想,蚂蚁技术研究院武威是典型代表。
武威本科和博士毕业于北大数学科学学院,曾获微软学者,历任微软小冰首席科学家、美团NLP中心负责人。他从数学出发,提出与主流不同的推理观点。
早在2023年下半年,武威团队就开始研究大模型推理。他认为R1 结果令人兴奋,但长思维链未必最优,因其维度高、能量高而不稳定。物理与化学表明能量最小结构最稳定,武威猜想未来推理模型可能是更低维、更稳定的系统。类似人类思考,系统1主导日常,消耗更低。
当前主流推理模型常出现结果正确但过程错误,长思维链纠错成本高。武威指出,推理过程可能比结果更重要,模型发现新知识(如数学新证法)更有价值。
如何结合系统1与系统2、快思考与慢思考,成为推理模型的重要方向。武威认为从数学角度设计优雅模型或追求自洽可能是终极解法。
以下是武威与AI科技评论的对话:
1. 什么是「推理」?
武威:推理是用逻辑组合知识解决新问题。R1 提供了可扩展的推理实现,但长思维链未必最优,因其维度高、能量高。
2. 「推理」为什么重要?
武威:“多快好省,双商齐备”是研究目标。推理让AI解决复杂问题,提升智商。情商方面,模型需理解情绪与心理状态。
3. 「推理」的解法猜想
武威:系统1与系统2结合是关键,需一个低维、稳定模型优化能量。未来研究可能从先规划再推理的层次化结构入手。
武威团队探索了AMOR、CodePlan、PromptCoT等项目,看到深度思考在其他任务中的潜力。
原文链接
本文链接:https://kx.umi6.com/article/18917.html
转载请注明文章出处
相关推荐
换一换
本周海外投资者抛售超过30亿美元韩国股票 上月已创纪录地抛售137亿美元
2026-03-04 17:00:06
浙江省省长刘捷:充分运用浙江在人工智能上的先发优势 加快产品迭代和价值实现
2026-03-18 20:56:54
贝莱德CEO:不认为人工智能存在泡沫 是技术主导权竞争
2026-03-25 16:40:42
韩文秀:全方位应对人工智能冲击 促进高质量充分就业
2026-03-22 11:38:30
银行间市场科创债机制进一步优化 鼓励主承销商积极服务人工智能、集成电路等关键领域企业
2026-03-02 18:53:14
四方精创投资成立科技公司 含多项AI业务
2026-03-18 15:37:21
深圳龙岗拟出台措施 支持OpenClaw&OPC发展
2026-03-08 17:26:26
2026年世界移动通信大会开幕
2026-03-02 18:53:32
中新对话活动探讨人工智能等领域合作
2026-03-23 21:53:32
高盛资管调查报告:超50%保险机构认为AI投资最大机会在基础设施、数据中心
2026-03-25 20:59:05
黄仁勋想不到!中国寻求突破NVIDIA CUDA护城河:一种前所未有的新方式
2026-04-08 18:04:21
OpenAI被曝将大规模招聘 到2026年底员工总数或达8000人
2026-03-22 17:00:26
TCL科技等成立创新科技技术公司 注册资本2亿元
2026-03-30 10:42:51
714 文章
582736 浏览
24小时热文
更多
-
2026-04-24 18:29:17 -
2026-04-24 18:28:12 -
2026-04-24 18:27:05