Meta公司于10月24日发布了Llama 3.2模型的量化版本,包括1B和3B两个版本,分别命名为Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA和Llama 3.2 3B SpinQuant。量化技术通过将浮点模型转换为定点模型,使得模型大小平均减少56%,RAM使用量减少41%,模型速度提高2至4倍,同时降低了功耗,使其适用于更多轻量级移动设备。Meta采用量化感知训练(QAT)和后训练量化(SpinQuant)两种方法进行模型优化,其中QAT更注重模型的准确性,SpinQuant则更强调模型的可移植性。尽管量化后模型仅支持8000个Token的上下文,而非原版的12.8万个Token,但其精度几乎与Llama BF16版本相同。目前,这些模型已在一加12、三星S24+/S22及部分苹果iOS设备上测试,结果显示运行效果良好。未来,研究人员计划利用神经处理单元进一步提升这些模型的性能。
原文链接
本文链接:https://kx.umi6.com/article/7917.html
转载请注明文章出处
相关推荐
换一换
Meta「缅北化」?
2025-11-13 10:54:30
Meta 签约多家媒体,为 Meta AI 聊天机器人带来更多新闻内容
2025-12-08 12:27:32
小甜甜变牛夫人,消息称扎克伯格将削减至多三成 Meta 元宇宙项目预算
2025-12-04 22:49:46
Meta高管回应AI泡沫质疑:如今繁荣看似激进 但并未失控
2025-11-16 19:48:26
收购「Manus」也治不好大厂的焦虑症
2026-01-06 19:24:45
Meta削减人工智能部门约600个职位,精简架构以加速组织转型
2025-10-23 02:55:30
亚历山大・王牵头,消息称 Meta 明年将推出全新图像视频与文本 AI 模型
2025-12-21 11:42:01
消息称 Meta 正就为自有数据中心导入 TPU AI 芯片与谷歌洽谈
2025-11-25 11:48:26
特斯拉 Optimus AI 团队负责人 Kumar 跳槽 Meta,自称“不是为了钱”
2025-09-19 20:20:05
你的绩效将跟“怎么用 AI”挂钩,Meta 明年引入全新员工评估机制
2025-11-15 16:59:23
张一鸣和奥特曼都得学小扎
2025-09-28 17:59:37
消息称 Meta 明年一季度发布全新 AI 模型 Avocado 牛油果,可能不会开源
2025-12-09 23:01:58
Meta 扩大员工使用竞争对手 AI 工具权限,含 ChatGPT-5、 Gemini 3 Pro 等
2025-12-17 13:42:35
768 文章
634517 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21