标题:苹果AI战略的新突破:高效大模型在手机端推理
今年WWDC,苹果展示了其AI重点,定义为"Apple Intelligence"。大模型虽强大,但手机内存受限,难以直接运行大型模型。为此,苹果发布了一篇关键论文,解决在手机上利用有限内存高效推理的问题。
论文核心是利用FFN层的稀疏性。大模型中,约1/3的Attention层参数常驻DRAM,而FFN层有高达95%的稀疏性,因为ReLU激活函数导致大部分输出为0。苹果通过构建低秩预测器,仅加载非零输出的神经元参数,以及采用滑动窗口技术(Windowing),每次处理固定长度的输入序列,进一步降低DRAM需求。同时,行列捆绑存储(Bundling)减少了数据读取次数,显著提高效率。
实验显示,苹果的优化方法在M1 Max上实现了6.5GB DRAM支持14.3GB大模型,提升了CPU速度4-5倍,GPU速度20-25倍,I/O延迟大幅下降。这预示着苹果在端侧AI领域的领导地位,并有望推动更多实时响应的任务应用。未来,手机和PC将成为90%推理任务的主力,苹果有望带来AI领域的重大突破。
原文链接
本文链接:https://kx.umi6.com/article/2153.html
转载请注明文章出处
相关推荐
换一换
对话杨元庆:未来1年端侧AI提升3倍性能,“这是短期内保守估计”丨直击MWC 2025
2025-03-07 09:32:23
装满智能体AI的手机,正在呼唤一个“Type-C时刻”
2025-04-16 13:02:45
斯坦福大模型推理课免费了,谷歌推理团队创始人主讲
2025-07-25 17:26:56
计算所严明玉团队新作: Attention 并非永远是瓶颈,多 GPU 并不一定更快
2025-12-22 11:41:00
端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
2024-09-10 19:45:30
王炸级3nm安卓AI芯片发布,生成视频不用联网
2024-10-17 16:09:05
苹果 Siri AI 进化:将支持读取屏幕、摘要内容、回答相关问题
2024-11-07 10:44:25
Deepseek大模型推理算法其实很简单
2025-02-09 16:51:53
手机端侧AI轻量化演进:3B模型渐成主流 智能体标准亟待完善
2025-10-11 13:30:31
中国电信“天翼”AI 手机发布:联合高通、中兴研发,端侧 3B 模型
2024-12-03 16:30:28
从骁龙8至尊版,我看到了AI手机的未来 | 智在终端
2024-12-17 13:03:17
北京国资领投 端侧AI公司面壁智能再获数亿元融资
2024-12-16 09:55:50
中国移动与荣耀合作AI手机 端侧AI站上MWC风口
2025-06-20 10:58:53
774 文章
691604 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41