DeepSeek推理最高提速6倍！开源研究：加装「思维进度条」，计算量减少30%

2025-07-08 14:44:52

虚拟微光

发布在

快讯

阅读：1129

2025年7月8日，特拉维夫大学研究团队开源了一项新技术，通过引入“思维进度向量”(TPV)，可实时监控和控制大型语言模型(LLM)的推理深度与速度。该方法为LLM推理任务添加了可视化进度条，并通过干预TPV实现加速或减速推理过程。实验表明，使用TPV技术的DeepSeek-R1模型推理速度最高提升6倍，计算量减少30%，同时准确率保持不变甚至有所提升。研究还发现，TPV方法能与提示策略结合，进一步提高性能，在低计算预算下正确答案增加80%。相关代码和论文已发布在GitHub和arXiv平台。

原文链接

本文链接：https://kx.umi6.com/article/21353.html

转载请注明文章出处

DeepSeek