1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

Meta公司于10月24日发布了Llama 3.2模型的量化版本,包括1B和3B两个版本,分别命名为Llama 3.2 1B QLoRA、Llama 3.2 1B SpinQuant、Llama 3.2 3B QLoRA和Llama 3.2 3B SpinQuant。量化技术通过将浮点模型转换为定点模型,使得模型大小平均减少56%,RAM使用量减少41%,模型速度提高2至4倍,同时降低了功耗,使其适用于更多轻量级移动设备。Meta采用量化感知训练(QAT)和后训练量化(SpinQuant)两种方法进行模型优化,其中QAT更注重模型的准确性,SpinQuant则更强调模型的可移植性。尽管量化后模型仅支持8000个Token的上下文,而非原版的12.8万个Token,但其精度几乎与Llama BF16版本相同。目前,这些模型已在一加12、三星S24+/S22及部分苹果iOS设备上测试,结果显示运行效果良好。未来,研究人员计划利用神经处理单元进一步提升这些模型的性能。

原文链接
本文链接:https://kx.umi6.com/article/7917.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Meta更新聊天机器人规则
2025-09-01 14:18:27
微软据悉加大力度抢夺AI人才 瞄准Meta多个团队
2025-08-13 16:38:52
Meta回应冻结AI部门招聘:仅为常规基础的组织架构调整
2025-08-21 14:37:51
又一华人科学家被挖走,OpenAI人才加速流失
2025-07-12 18:54:36
小扎1亿美金挖角OpenAI天才:华人工程师身价为何能媲美C罗?
2025-07-06 20:19:10
Claude翻车:Opus 4.1白天退化,Anthropic承认并回滚更新
2025-09-01 18:21:10
Meta任命赵晟佳为超级智能实验室首席科学家
2025-07-26 06:33:54
Meta反悔了?前脚刚暂停招聘 后脚又挖走一位苹果高管
2025-08-22 17:52:10
Meta与Midjourney合作开发AI图像和视频模型
2025-08-25 08:28:36
得州总检察长调查Meta和Character.AI
2025-08-19 09:57:59
扎克伯格:META将在人工智能领域投资数千亿美元
2025-07-14 23:30:19
小扎亲自出马挽留AI 大神,结果毒鸡汤把人劝跑了?
2025-08-26 13:44:19
Meta万引强化学习大佬跑路!用小扎原话作为离别寄语,扎心了
2025-08-26 13:43:07
24小时热文
更多
扫一扫体验小程序