1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:打破推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了

正文:
不再像“思维链”那样逐字生成,加入“软思维”后,大模型能像人类一样进行抽象思考。来自SimularAI和微软DeepSpeed的研究团队提出“Soft Thinking”,让模型在“连续概念空间”中推理,而非局限于离散的token,从而突破基于离散token的推理瓶颈。

相比标准CoT,Soft Thinking提升了Pass@1平均准确率2.48%,并减少了22.4%的token使用量。更重要的是,它是一种“即插即用”的推理策略,无需额外训练即可应用于现有模型,如Llama、Qwen等。

主流语言模型推理面临的问题是只能逐字生成离散的语言符号,这限制了抽象概念的表达能力,并易因单一路径选择出错。而人类推理依靠灵活整合抽象概念。受此启发,Soft Thinking将推理从“离散符号空间”扩展到“连续概念空间”,使模型能在细微语义间捕捉概念,更灵活地探索多种解题路径,同时保持高效和可解释性。

Soft Thinking仅修改传统CoT的中间推理阶段,保留最终答案的离散生成。其理论基础是“线性近似替代路径枚举”,通过概率加权替代离散采样,利用连续概念空间中的线性变换聚合多条路径信息,避免计算爆炸。此外,通过概念token的概率分布代替单一符号,模型能同时保留多种推理可能性。

为了防止无效循环,Soft Thinking引入“Cold Stop”机制,通过熵值监测模型的自信程度,当模型足够确定时,提前终止中间步骤,直接生成答案。

测试结果显示,QwQ – 32B模型的平均Pass@1准确率从83.84%提升至86.32%,最高提升2.48%。在数学任务中,DeepSeek-R1-Distill-Qwen-32B的token使用量减少22.4%。与COCONUT-TF和平均嵌入策略相比,Soft Thinking在效率和准确性上均有显著优势。

官方网站:https://soft-thinking.github.io/
论文地址:https://arxiv.org/abs/2505.15778
代码地址:https://github.com/eric-ai-lab/Soft-Thinking
参考链接:https://x.com/xwang_lk/status/1925399783503798692

原文链接
本文链接:https://kx.umi6.com/article/19175.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它
2026-06-03 00:53:27
Manus救不了Meta
2026-01-08 20:35:12
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
卓世科技,股改完成!
2026-01-05 15:08:15
智谱上市后首份财报:超7.24亿元!国内收入最高大模型公司,MaaS发力了
2026-03-31 21:04:07
智谱中标679.8万元水电大模型项目
2025-11-05 20:23:03
大模型收入暴涨1076%,港股AGI第一股首份年报:一年狂揽12亿,属实把商业化玩明白了
2026-03-27 17:08:13
把12个AI凑到一起打工,它们竟然搞起“小团体”?
2025-10-16 22:02:39
大厂AI新战场:AQ狂飙,蚂蚁押注大健康赛道
2025-11-09 16:34:57
消息称腾讯大模型团队架构调整:前 OpenAI 研究员姚顺雨任要职,校招最高 2 倍薪资挖 AI 人才
2025-12-17 17:57:42
上海已发布超150款备案大模型
2026-03-28 20:16:44
顶尖技术+标准产品+创新模式+可靠服务,打造大模型商业落地中国范式
2025-12-16 10:32:22
24小时热文
更多
扫一扫体验小程序