摘要: 随着2024年的过半,AI领域内普遍认识到,AI技术的价值在于其广泛的应用。各大科技公司,包括互联网巨头和手机制造商,都在积极探索AI杀手级应用。焦点集中在如何使大规模模型在手机等资源受限的终端设备上流畅运行。在顶级学术会议ICML和CVPR上,高通展示了在安卓手机上本地部署大规模多模态模型的实例,如LLaVA和LoRA,以及音频驱动的3D数字人AI助手。高通的研究着重于通过量化技术提高计算性能和内存效率,尤其指出4位权重量化在生成式AI中的可行性,相比于浮点模型,INT4模型在性能和能效上均有显著提升。 高通还提出了LR-QAT算法,利用低秩量化感知训练实现高效推理,且内存使用远低于全模型量化。此外,高通在矢量量化技术上也有所突破,通过考虑参数的联合分布来实现更高效的压缩。编译器优化方面,高通的Direct框架基于硬件架构和内存层级进行运算排序,提高了性能并减少了内存溢出。在硬件加速方面,第三代骁龙8移动平台的Hexagon NPU在性能和能效上有显著提升,支持更复杂的Transformer网络,使得手机上运行大模型成为可能。高通的这些研究不仅推动了AI在终端侧的应用,也为XR和自动驾驶等领域提供了高效多视图视频压缩方法。整体而言,高通的技术布局展示了AI从云端到终端的全栈优化能力,为AI应用的普及化奠定了坚实的基础。
原文链接
本文链接:https://kx.umi6.com/article/5855.html
转载请注明文章出处
相关推荐
换一换
独家 | 刘炯接管 GN06 团队,向美团平台负责人李树斌汇报
2025-11-17 12:25:02
谷歌nano banana火爆出圈 AI应用有望站上市场风口
2025-09-01 08:15:00
中信建投:看好AI应用落地与AI算力需求增长
2026-04-28 08:02:34
全球增长最快AI应用!公测仅23天千问月活跃用户数破3000万
2025-12-10 11:45:32
AI应用、储能与机器人在2026年的预期差
2026-01-06 19:27:09
盘前题材挖掘
2025-12-22 09:34:10
AI应用的三个真相:革命未至,真金浮现
2026-01-17 18:41:02
三大AI应用春节DAU创新高 千问缩小与豆包差距
2026-02-27 11:33:59
15人,每年干出百万美元营收
2025-09-24 13:39:50
新增10家上榜AI应用小团队,他们靠“交付结果”年入千万美元
2025-08-14 23:04:41
LiblibAI完成1.3亿美元B轮融资 为中国AI应用今年最大融资
2025-10-22 22:54:13
倒计时一周,AIGC峰会嘉宾又上新了!一起来看第三波嘉宾
2026-05-14 00:03:28
智能体需求井喷!金融、办公、消费电子、文旅等场景全面开花|直击WAIC
2025-07-28 20:19:25
720 文章
682784 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08