Meta公司于10月24日发布了Llama 3.2模型的量化版本,包括1B和3B两个版本,分别命名为Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA和Llama 3.2 3B SpinQuant。量化技术通过将浮点模型转换为定点模型,使得模型大小平均减少56%,RAM使用量减少41%,模型速度提高2至4倍,同时降低了功耗,使其适用于更多轻量级移动设备。Meta采用量化感知训练(QAT)和后训练量化(SpinQuant)两种方法进行模型优化,其中QAT更注重模型的准确性,SpinQuant则更强调模型的可移植性。尽管量化后模型仅支持8000个Token的上下文,而非原版的12.8万个Token,但其精度几乎与Llama BF16版本相同。目前,这些模型已在一加12、三星S24+/S22及部分苹果iOS设备上测试,结果显示运行效果良好。未来,研究人员计划利用神经处理单元进一步提升这些模型的性能。
原文链接
本文链接:https://kx.umi6.com/article/7917.html
转载请注明文章出处
相关推荐
换一换
Meta启动裁员 战略重心从元宇宙转向AI设备
2026-01-14 00:02:07
Meta将削减人工智能部门约600个职位 以提升决策效率
2025-10-22 23:55:49
Meta 被指 AI 生成广告泛滥,多名英国消费者称花高价买到“假英国品牌”
2025-11-29 16:23:36
雷朋母公司:2025年与Meta合作的AI眼镜销量实现超3倍增长
2026-02-12 13:26:38
Manus卖给了Meta
2025-12-30 15:25:08
Meta使用阿里千问优化其最新AI模型
2025-12-11 00:19:01
Meta公开抄阿里Qwen作业,还闭源了…
2025-12-11 12:47:10
AI支出失控?Meta市值一夜蒸发逾1.5万亿 目标价遭投行密集下调
2025-10-31 09:27:19
Meta打碎Transformer 8年铁律!改写AI最底层规则,模型首次冒出潜意识
2025-10-25 12:20:19
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
Manus收购案细节曝光:20亿刀闪电成交,CEO不向亚历山大王汇报
2025-12-31 10:09:33
Meta与Blue Owl Capital合作开展270亿美元AI数据中心项目
2025-10-22 08:45:48
小甜甜变牛夫人,消息称扎克伯格将削减至多三成 Meta 元宇宙项目预算
2025-12-04 22:49:46
799 文章
733589 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08