不要思考过程，推理模型能力能够更强丨UC伯克利等最新研究

2025-04-30 18:55:15

像素宇宙

发布在

科普

阅读：653

标题：推理模型无需深思熟虑也能更高效

正文：
其实……推理模型无需冗长思考也能有效推理！这听起来或许有些反常识，毕竟人们常认为推理模型的强大得益于详尽的思考过程。然而，这种耗时且需大量算力的过程并非唯一出路。UC伯克利与艾伦实验室团队的研究表明，“无思考（NoThinking）”方法可能更为高效。

NoThinking方法通过简单的提示绕过显式思考，直接生成解决方案。实验显示，在低资源或低延迟情况下，该方法的表现优于传统思考方式，实现了精度与延迟之间的更优平衡。即使在其他场景下，NoThinking在部分数据集上的表现也超越了传统思考方法。

研究团队基于DeepSeek-R1-Distill-Qwen模型提出NoThinking方法。传统“思考”方法会让模型逐步分解问题、验证步骤并得出答案，而NoThinking则直接从预设的“思考”标记开始生成最终方案，省去了详细思考步骤，减少了token数量，提升了推理速度。

在数学、编程及形式定理证明等任务中，NoThinking方法展现出了显著优势。例如，在AIME和AMC数据集上，相同token预算下，NoThinking的准确率明显高于传统方法。而在MiniF2F和ProofNet数据集中，NoThinking在保持高准确性的同时大幅降低了计算成本。编程任务中，低资源环境下NoThinking效率更高，高资源时效果接近传统方法。

此外，NoThinking在多次采样中表现出更高的多样性，pass@k指标随k值增大而提升。结合并行扩展，NoThinking不仅降低了延迟，还减少了token使用量，尤其在有校验器的任务中表现尤为突出。

这项研究颠覆了“推理模型必须依赖详细思考过程”的观念，表明更高效的推理方式是可行的。尽管实际应用中可能需要额外的人工筛选，但这一新视角无疑为未来推理模型的优化提供了新思路。或许不久后，我们等待精准答案的时间会大大缩短。

原文链接

本文链接：https://kx.umi6.com/article/17935.html

转载请注明文章出处

NoThinking