大模型的应用正逐步拓展至终端侧,揭示了AI竞争的关键所在。随着2024年的进程过半,AI技术的价值愈发显现,其核心在于应用的广泛性。各大科技巨头,包括互联网公司与手机制造商,纷纷投入资源寻找杀手级应用,这一趋势在顶级学术会议上也得到了印证。
焦点集中在如何使大模型在手机等资源受限的设备上流畅运行。在ICML、CVPR等国际顶会的最新成果中,我们看到了安卓手机厂商与高通的深度合作,如实现多模态大模型LLaVA的本地部署,以及展示的LoRA与3D数字人AI助手实例,均展示了技术的成熟度与实用性。
高通的研究强调了几个关键领域:量化、编译与硬件加速。量化技术通过降低精度提升计算性能与内存效率,尤其在生成式AI中,通过量化至INT4模型,实现高效推理与能效提升。此外,矢量量化技术与高效编译策略进一步优化了资源利用。在硬件层面,高通的AI引擎通过异构计算架构,优化了内存使用与性能表现,特别是在第三代骁龙8移动平台上,Hexagon NPU显著提高了大模型处理速度与能效。
高通的研究不仅限于手机领域,还覆盖了XR与自动驾驶等场景,展示了其在生成式AI与多视图视频压缩等技术的前沿探索。AI视频生成技术也在优化中,旨在提高终端侧的视频处理效率。
高通的AI软件栈整合了多种工具与服务,提供了一站式的AI解决方案,支持跨设备的模型部署,推动了大模型应用在不同智能终端的普及。这种技术布局不仅加速了大模型的商业化进程,也为整个行业带来了创新与繁荣。
AI技术的发展离不开基础研究与应用实践的双轮驱动。高通深耕AI领域多年,致力于将AI能力融入终端设备的核心功能中,其研究成果不仅推动了自身的技术创新,也对整个行业产生了深远影响。随着技术的不断进步与普及,AI将深入人们生活的更多方面,创造更大的社会价值。
原文链接
本文链接:https://kx.umi6.com/article/5748.html
转载请注明文章出处
相关推荐
.png)
换一换
推理成本骤降75%!gpt-oss用新数据类型实现4倍推理速度,80GB显卡能跑1200亿参数大模型
2025-08-11 16:04:21
人类正在被AI「幻觉」欺骗
2025-08-20 10:10:57
中信建投武超则:大模型的迭代永无止境 坚定看好接下来AI应用的发展表现
2025-07-16 18:10:08
美团发布并开源 LongCat-Flash-Chat 大模型:总参数 560B,AI 智能体任务表现突出
2025-09-01 11:16:10
中信证券:“人工智能+”行动发布,AI应用有望加速普及
2025-08-28 09:17:15
在上海WAIC,800展商无一不想成为黄仁勋
2025-07-27 07:50:27
大模型首次直接理解代码图:不用 Agent 自动修 bug,登顶 SWE-Bench 开源模型榜单
2025-06-27 15:12:57
航空发动机用上大模型:解决复杂时序问题,性能超越ChatGPT-4o实现SOTA|上交创智复旦
2025-06-28 13:23:44
李彦宏:百度下一代旗舰大模型研发中 会在准备就绪后尽快发布
2025-08-20 21:19:28
Scaling Law再遭质疑:“退化式AI”竟成终局?
2025-08-04 21:03:25
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
470 文章
160155 浏览
24小时热文
更多

-
2025-09-06 23:39:46
-
2025-09-06 22:39:24
-
2025-09-06 21:38:26