1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

摘要: 随着2024年的过半,AI领域内普遍认识到,AI技术的价值在于其广泛的应用。各大科技公司,包括互联网巨头和手机制造商,都在积极探索AI杀手级应用。焦点集中在如何使大规模模型在手机等资源受限的终端设备上流畅运行。在顶级学术会议ICML和CVPR上,高通展示了在安卓手机上本地部署大规模多模态模型的实例,如LLaVA和LoRA,以及音频驱动的3D数字人AI助手。高通的研究着重于通过量化技术提高计算性能和内存效率,尤其指出4位权重量化在生成式AI中的可行性,相比于浮点模型,INT4模型在性能和能效上均有显著提升。 高通还提出了LR-QAT算法,利用低秩量化感知训练实现高效推理,且内存使用远低于全模型量化。此外,高通在矢量量化技术上也有所突破,通过考虑参数的联合分布来实现更高效的压缩。编译器优化方面,高通的Direct框架基于硬件架构和内存层级进行运算排序,提高了性能并减少了内存溢出。在硬件加速方面,第三代骁龙8移动平台的Hexagon NPU在性能和能效上有显著提升,支持更复杂的Transformer网络,使得手机上运行大模型成为可能。高通的这些研究不仅推动了AI在终端侧的应用,也为XR和自动驾驶等领域提供了高效多视图视频压缩方法。整体而言,高通的技术布局展示了AI从云端到终端的全栈优化能力,为AI应用的普及化奠定了坚实的基础。

原文链接
本文链接:https://kx.umi6.com/article/5855.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
和互联网一样,国产AI产品重回“大厂叙事”时代
2025-10-22 09:42:30
马斯克宣布将推出儿童版 AI 应用“Baby Grok”,暂未披露功能细节
2025-07-20 14:03:49
2025年,AI应用走到哪一步了?
2026-01-15 11:31:40
百度世界2025将于11月13日在北京举办
2025-10-13 20:03:11
这款应用爆火背后,AI下半场正从「聊天」变「办事」
2025-11-27 16:49:01
盘前题材挖掘
2025-12-22 09:34:10
中信证券:AI对计算机板块的增长贡献将进一步提升 看好新一轮行情机遇
2025-09-08 08:59:49
腾讯发布混元3D世界模型、具身智能平台Tairos
2025-07-27 10:55:43
5月国内AI应用全景洞察:头部效应加剧,多数赛道增长乏力
2025-06-18 21:48:08
GPT-5要来了?OpenAI官方预告引遐想 AI应用或迎来加速发展
2025-08-07 09:47:28
企业端成AI应用主阵地!上市公司瞄准企业软件“蛋糕” Agent将是重要形态
2025-08-20 00:08:09
2025骁龙峰会·中国开幕,高通携手生态伙伴发布“AI加速计划”
2025-09-24 20:50:01
Tokens 经济崛起:IDC 报告揭示 AI 应用新风向,火山引擎领跑市场
2025-10-15 15:39:17
24小时热文
更多
扫一扫体验小程序