Meta公司于10月24日发布了Llama 3.2模型的量化版本,包括1B和3B两个版本,分别命名为Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA和Llama 3.2 3B SpinQuant。量化技术通过将浮点模型转换为定点模型,使得模型大小平均减少56%,RAM使用量减少41%,模型速度提高2至4倍,同时降低了功耗,使其适用于更多轻量级移动设备。Meta采用量化感知训练(QAT)和后训练量化(SpinQuant)两种方法进行模型优化,其中QAT更注重模型的准确性,SpinQuant则更强调模型的可移植性。尽管量化后模型仅支持8000个Token的上下文,而非原版的12.8万个Token,但其精度几乎与Llama BF16版本相同。目前,这些模型已在一加12、三星S24+/S22及部分苹果iOS设备上测试,结果显示运行效果良好。未来,研究人员计划利用神经处理单元进一步提升这些模型的性能。
原文链接
本文链接:https://kx.umi6.com/article/7917.html
转载请注明文章出处
相关推荐
换一换
Meta 狂揽天下 AI 英才副作用,引发人事震荡
2025-08-30 09:48:42
挖人策略失灵了?Meta或已调整AI战略 产品有望引入外部模型
2025-08-30 17:55:22
Meta 被曝擅自开发名人形象“调情”聊天机器人,霉霉、斯嘉丽都未能幸免
2025-08-30 11:50:31
AI 领域亦对手亦客户:消息称 Meta 与谷歌云签订 6 年超 100 亿美元大单
2025-08-22 14:51:49
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
LeCun不想再忍了!亲口承认要辞职
2025-10-03 12:38:31
成人内容提供商起诉 Meta:指控其利用盗版内容训练 AI 模型
2025-07-29 18:33:38
硅谷巨头强强联手!谷歌与Meta达成100亿美元云计算合同
2025-08-22 10:52:34
Meta被曝已暂停AI招聘
2025-08-21 11:32:08
AI眼镜热度不减 Meta最新产品卖断货 CTO称销售点数量将翻番
2025-10-05 12:18:57
消息称 Meta 超级智能实验室已招募 44 人:一半来自中国,40% 曾在 OpenAI 任职
2025-07-20 17:06:49
微软反制Meta发起人才狙击战!「精准打击」名单+特制数百万美元薪酬包,高管24小时内批复
2025-08-13 17:40:52
Meta Facebook 新增 AI 拼贴照片编辑功能引隐私争议,用户利用平台工具修图即被视为训练素材
2025-10-18 07:29:23
580 文章
297536 浏览
24小时热文
更多
-
2025-10-28 07:35:08 -
2025-10-28 04:29:46 -
2025-10-28 02:26:29