1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

摘要: 随着2024年的过半,AI领域内普遍认识到,AI技术的价值在于其广泛的应用。各大科技公司,包括互联网巨头和手机制造商,都在积极探索AI杀手级应用。焦点集中在如何使大规模模型在手机等资源受限的终端设备上流畅运行。在顶级学术会议ICML和CVPR上,高通展示了在安卓手机上本地部署大规模多模态模型的实例,如LLaVA和LoRA,以及音频驱动的3D数字人AI助手。高通的研究着重于通过量化技术提高计算性能和内存效率,尤其指出4位权重量化在生成式AI中的可行性,相比于浮点模型,INT4模型在性能和能效上均有显著提升。 高通还提出了LR-QAT算法,利用低秩量化感知训练实现高效推理,且内存使用远低于全模型量化。此外,高通在矢量量化技术上也有所突破,通过考虑参数的联合分布来实现更高效的压缩。编译器优化方面,高通的Direct框架基于硬件架构和内存层级进行运算排序,提高了性能并减少了内存溢出。在硬件加速方面,第三代骁龙8移动平台的Hexagon NPU在性能和能效上有显著提升,支持更复杂的Transformer网络,使得手机上运行大模型成为可能。高通的这些研究不仅推动了AI在终端侧的应用,也为XR和自动驾驶等领域提供了高效多视图视频压缩方法。整体而言,高通的技术布局展示了AI从云端到终端的全栈优化能力,为AI应用的普及化奠定了坚实的基础。

原文链接
本文链接:https://kx.umi6.com/article/5855.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
中国银河证券:AI应用持续推进游戏行业有望保持高景气度
2025-09-16 08:08:10
2025骁龙峰会·中国开幕,高通携手生态伙伴发布“AI加速计划”
2025-09-24 20:50:01
88%的公司在用AI,但只有39%吃到真金白银?麦肯锡2025 AI报告来了
2025-11-10 16:21:25
AI应用爆发前夜,谁将获得黄金机遇
2025-08-25 18:33:29
马斯克宣布将推出儿童版 AI 应用“Baby Grok”,暂未披露功能细节
2025-07-20 14:03:49
30家Tokens吞金兽,每家烧光万亿Tokens!OpenAI最大客户名单曝光,多邻国上榜
2025-10-09 09:05:46
比AI更懂老外的,可能是中国人
2025-10-31 11:27:22
百度世界 2025 大会将于 11 月 13 日在北京举行,主题“效果涌现”
2025-10-17 19:25:29
中国AI应用,正在海外闷声发财
2025-08-14 11:52:09
训练大模型烧了那么多钱,商业价值到底在哪?
2025-07-04 09:39:31
既强大又平庸,AI应用为何活得如此拧巴?
2025-06-24 14:17:34
中信证券:关注半导体、AI应用、AI算力、海外储能及风电等五大主题方向
2025-10-01 16:46:46
全球增长最快AI应用!公测仅23天千问月活跃用户数破3000万
2025-12-10 11:45:32
24小时热文
更多
扫一扫体验小程序