多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

2025-09-26 14:29:23

Nebula

发布在

科普

阅读：2168

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

华为诺亚方舟实验室提出了一种全新推理加速框架——视觉感知投机推理（ViSpec），在不牺牲生成质量的前提下，将多模态大模型（VLM）推理速度最高提升3.22倍。这一突破性成果已入选NeurIPS 2025。

目前，投机推理技术在纯文本领域表现优异，但在多模态任务中却因视觉信息处理难题而受限，加速效果不足1.5倍。ViSpec通过三大创新设计解决了这一问题：

实验表明，ViSpec在多个主流VLM（如LLaVA、Qwen2.5-VL）上实现了1.85至3.22倍的加速，平均加速比达2.5倍，且生成质量无损。消融实验进一步验证了各模块的有效性，图像嵌入压缩、全局特征注入和数据合成分别贡献了30%、7%和30%的性能提升。

ViSpec的提出为VLM的实际应用铺平了道路，未来有望在手机、汽车等边缘设备上实现更高效、智能的人机交互。

论文链接：https://arxiv.org/abs/2509.15235
项目地址：https://github.com/KangJialiang/ViSpec

原文链接

本文链接：https://kx.umi6.com/article/25933.html

转载请注明文章出处

ViSpec

华为诺亚

多模态推理

分享至

打开微信扫一扫

内容投诉

生成图片

Nebula

729 文章

805468 浏览

24小时热文