1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:推理模型无需深思熟虑也能更高效

正文:
其实……推理模型无需冗长思考也能有效推理!这听起来或许有些反常识,毕竟人们常认为推理模型的强大得益于详尽的思考过程。然而,这种耗时且需大量算力的过程并非唯一出路。UC伯克利与艾伦实验室团队的研究表明,“无思考(NoThinking)”方法可能更为高效。

NoThinking方法通过简单的提示绕过显式思考,直接生成解决方案。实验显示,在低资源或低延迟情况下,该方法的表现优于传统思考方式,实现了精度与延迟之间的更优平衡。即使在其他场景下,NoThinking在部分数据集上的表现也超越了传统思考方法。

研究团队基于DeepSeek-R1-Distill-Qwen模型提出NoThinking方法。传统“思考”方法会让模型逐步分解问题、验证步骤并得出答案,而NoThinking则直接从预设的“思考”标记开始生成最终方案,省去了详细思考步骤,减少了token数量,提升了推理速度。

在数学、编程及形式定理证明等任务中,NoThinking方法展现出了显著优势。例如,在AIME和AMC数据集上,相同token预算下,NoThinking的准确率明显高于传统方法。而在MiniF2F和ProofNet数据集中,NoThinking在保持高准确性的同时大幅降低了计算成本。编程任务中,低资源环境下NoThinking效率更高,高资源时效果接近传统方法。

此外,NoThinking在多次采样中表现出更高的多样性,pass@k指标随k值增大而提升。结合并行扩展,NoThinking不仅降低了延迟,还减少了token使用量,尤其在有校验器的任务中表现尤为突出。

这项研究颠覆了“推理模型必须依赖详细思考过程”的观念,表明更高效的推理方式是可行的。尽管实际应用中可能需要额外的人工筛选,但这一新视角无疑为未来推理模型的优化提供了新思路。或许不久后,我们等待精准答案的时间会大大缩短。

原文链接
本文链接:https://kx.umi6.com/article/17935.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
什么是真正好用的推理模型?阶跃Step 3:开源的,多模态的,低成本的,国产芯片适配的
2025-07-28 10:09:36
免费o1替代品来了!谷歌新发“王炸”推理大模型:思考速度碾压其他大模型,水平堪比理科博士
2024-12-23 10:51:33
32B 稠密模型推理能力超越 R1?秘密 AI 团队发布推理小模型 AM-Thinking-v1
2025-05-16 14:53:48
法国人工智能公司Mistral发布首个推理模型 支持欧洲多种语言
2025-06-10 20:54:31
Qwen版o1发布即开源!32B参数比肩OpenAI o1-mini,一手实测在此
2024-11-28 21:36:58
OpenAI 阿尔特曼:计划几周内推出 o3 mini 推理模型
2025-01-18 08:30:22
o3-pro答高难题文字游戏引围观,OpenAI前员工讽刺苹果:这都不叫推理那什么叫推理
2025-06-13 12:06:17
在DeepSeek老家发新模型,豆包怎么想的?
2025-04-18 16:15:50
新研究:AI 推理模型在输掉国际象棋比赛之前会试图“作弊”扭转局面
2025-02-22 10:09:49
阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507,多项能力显著提升
2025-07-31 07:59:58
新“SOTA”推理模型避战Qwen和R1?欧版OpenAI被喷麻了
2025-06-11 15:12:46
阿里自研“深度思考”推理模型已上线夸克 AI 搜索,后续将有更强模型上线
2025-03-01 15:00:52
5分钟读懂Lilian Weng万字长文:大模型是怎么思考的?
2025-05-22 18:40:48
24小时热文
更多
扫一扫体验小程序