Meta公司于10月24日发布了Llama 3.2模型的量化版本,包括1B和3B两个版本,分别命名为Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA和Llama 3.2 3B SpinQuant。量化技术通过将浮点模型转换为定点模型,使得模型大小平均减少56%,RAM使用量减少41%,模型速度提高2至4倍,同时降低了功耗,使其适用于更多轻量级移动设备。Meta采用量化感知训练(QAT)和后训练量化(SpinQuant)两种方法进行模型优化,其中QAT更注重模型的准确性,SpinQuant则更强调模型的可移植性。尽管量化后模型仅支持8000个Token的上下文,而非原版的12.8万个Token,但其精度几乎与Llama BF16版本相同。目前,这些模型已在一加12、三星S24+/S22及部分苹果iOS设备上测试,结果显示运行效果良好。未来,研究人员计划利用神经处理单元进一步提升这些模型的性能。
原文链接
本文链接:https://kx.umi6.com/article/7917.html
转载请注明文章出处
相关推荐
换一换
积极扩展内容 AI 授权:消息称 Meta 正与施普林格、福克斯、新闻集团谈判
2025-09-22 15:59:41
拒绝小扎15亿美元offer的大佬,还是加入Meta了
2025-10-12 10:40:02
Meta将投资俄亥俄州与宾夕法尼亚州核电厂以支持AI发展
2026-01-09 19:32:34
Meta Facebook 新增 AI 拼贴照片编辑功能引隐私争议,用户利用平台工具修图即被视为训练素材
2025-10-18 07:29:23
消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
2025-11-25 11:48:26
Meta猛挖字节墙脚
2025-11-26 09:34:54
Meta可能在明年初推出新AI大模型Avocado
2025-12-09 22:02:45
“AI争霸”格局大变:Alphabet被热捧Meta却坐冷板凳,为何?
2025-10-31 16:40:59
Meta 收购 Manus 细节曝光,开价 20 亿美元闪电成交
2025-12-31 16:29:56
扎克伯格不挖人了?消息称 Meta 考虑采用 OpenAI 或谷歌的 AI 模型
2025-08-30 10:50:03
Meta和Scale AI闹翻!砸143亿买的高管跑路,业务也合作不下去
2025-09-01 15:17:44
Meta 出手,帮家长从容应对孩子“AI 聊天成瘾”
2025-10-20 08:59:04
小扎再出奇招:Meta员工绩效,AI来评判
2025-11-17 22:43:50
695 文章
480536 浏览
24小时热文
更多
-
2026-01-24 15:06:49 -
2026-01-24 15:05:40 -
2026-01-24 15:04:33