1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:蚂蚁武威:下一代「推理」模型范式大猜想

正文:
R1 后,长思维链成为下一代基础模型推理能力研究的热门方向。R1 表明大模型深度思考可行,但推理序幕才刚开启。R1 还影响了国内研究,激励更多人提出前瞻技术思想,蚂蚁技术研究院武威是典型代表。

武威本科和博士毕业于北大数学科学学院,曾获微软学者,历任微软小冰首席科学家、美团NLP中心负责人。他从数学出发,提出与主流不同的推理观点。

早在2023年下半年,武威团队就开始研究大模型推理。他认为R1 结果令人兴奋,但长思维链未必最优,因其维度高、能量高而不稳定。物理与化学表明能量最小结构最稳定,武威猜想未来推理模型可能是更低维、更稳定的系统。类似人类思考,系统1主导日常,消耗更低。

当前主流推理模型常出现结果正确但过程错误,长思维链纠错成本高。武威指出,推理过程可能比结果更重要,模型发现新知识(如数学新证法)更有价值。

如何结合系统1与系统2、快思考与慢思考,成为推理模型的重要方向。武威认为从数学角度设计优雅模型或追求自洽可能是终极解法。

以下是武威与AI科技评论的对话:

1. 什么是「推理」?
武威:推理是用逻辑组合知识解决新问题。R1 提供了可扩展的推理实现,但长思维链未必最优,因其维度高、能量高。

2. 「推理」为什么重要?
武威:“多快好省,双商齐备”是研究目标。推理让AI解决复杂问题,提升智商。情商方面,模型需理解情绪与心理状态。

3. 「推理」的解法猜想
武威:系统1与系统2结合是关键,需一个低维、稳定模型优化能量。未来研究可能从先规划再推理的层次化结构入手。

武威团队探索了AMOR、CodePlan、PromptCoT等项目,看到深度思考在其他任务中的潜力。

原文链接
本文链接:https://kx.umi6.com/article/18917.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
广东:支持人工智能等新兴未来产业领域OPC发展
2026-05-15 16:57:42
美国防部与7家AI公司达成协议
2026-05-01 20:48:28
四川:加快推进智能机器人(犬)、智能网联汽车等智能装备迭代升级和应用推广
2026-05-08 16:32:40
大洋电机成立机器人科技公司 含多项AI业务
2026-05-13 14:44:23
交通运输部:大力实施公路更新和数智化改造 深入实施“人工智能+交通运输”行动
2026-05-22 20:03:37
国家数据局:筑牢数字基础设施底座 强化数据赋能人工智能发展
2026-05-19 20:54:51
白宫举行吹风会 向人工智能公司介绍审查AI模型的行政令
2026-05-21 09:31:43
韩国副总理喊话:AI赚翻却险遭罢工 财富必须普惠全民!
2026-05-25 14:37:20
OpenAI首席执行官:AI普及并不会引发“就业末日”
2026-05-26 16:40:26
三部门:力争到2030年 人工智能算力设施的清洁能源供给保障能力和能源领域人工智能应用水平大幅提升
2026-05-08 17:30:58
山东:到2028年全省人工智能产业营业收入突破2500亿元、占全国比重超过10%
2026-05-21 13:43:39
韩正出席2026世界数字教育大会开幕式并致辞
2026-05-11 19:26:12
中美正考虑启动有关人工智能的官方讨论?外交部回应
2026-05-07 15:28:58
24小时热文
更多
扫一扫体验小程序