1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:推理模型无需深思熟虑也能更高效

正文:
其实……推理模型无需冗长思考也能有效推理!这听起来或许有些反常识,毕竟人们常认为推理模型的强大得益于详尽的思考过程。然而,这种耗时且需大量算力的过程并非唯一出路。UC伯克利与艾伦实验室团队的研究表明,“无思考(NoThinking)”方法可能更为高效。

NoThinking方法通过简单的提示绕过显式思考,直接生成解决方案。实验显示,在低资源或低延迟情况下,该方法的表现优于传统思考方式,实现了精度与延迟之间的更优平衡。即使在其他场景下,NoThinking在部分数据集上的表现也超越了传统思考方法。

研究团队基于DeepSeek-R1-Distill-Qwen模型提出NoThinking方法。传统“思考”方法会让模型逐步分解问题、验证步骤并得出答案,而NoThinking则直接从预设的“思考”标记开始生成最终方案,省去了详细思考步骤,减少了token数量,提升了推理速度。

在数学、编程及形式定理证明等任务中,NoThinking方法展现出了显著优势。例如,在AIME和AMC数据集上,相同token预算下,NoThinking的准确率明显高于传统方法。而在MiniF2F和ProofNet数据集中,NoThinking在保持高准确性的同时大幅降低了计算成本。编程任务中,低资源环境下NoThinking效率更高,高资源时效果接近传统方法。

此外,NoThinking在多次采样中表现出更高的多样性,pass@k指标随k值增大而提升。结合并行扩展,NoThinking不仅降低了延迟,还减少了token使用量,尤其在有校验器的任务中表现尤为突出。

这项研究颠覆了“推理模型必须依赖详细思考过程”的观念,表明更高效的推理方式是可行的。尽管实际应用中可能需要额外的人工筛选,但这一新视角无疑为未来推理模型的优化提供了新思路。或许不久后,我们等待精准答案的时间会大大缩短。

原文链接
本文链接:https://kx.umi6.com/article/17935.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
推理模型 DeepSeek-R1-Lite 预览版上线,号称媲美 OpenAI o1-preview
2024-11-20 23:21:18
OpenAI更新推理模型o3-mini思维链
2025-02-07 10:54:40
闫俊杰不甘心
2025-06-09 17:31:16
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
2025-02-07 08:47:13
谷歌发布新一代推理模型Gemini2.5:单次可处理百万token
2025-03-26 11:51:49
OpenAI罕见宣布将开源推理模型,DeepSeek给逼的
2025-04-01 08:17:21
OpenAI新模型首次实现「图像思维」
2025-04-18 12:09:19
MiniMax正暗戳戳憋大招
2025-06-02 07:30:05
OpenAI o3 AI 推理模型成关键“侦探”,发现 Linux 内核高危漏洞
2025-05-30 11:50:26
MiniMax开源首个推理模型M1
2025-06-17 10:22:32
DeepSeek登顶中美App Store:思考过程比答案更有价值
2025-01-27 11:27:10
消息称亚马逊正开发推理模型 Nova:又要快又要能深度思考
2025-03-04 19:27:39
24小时热文
更多
扫一扫体验小程序