4月18日,谷歌发布Gemna 3 QAT AI模型,通过量化感知训练显著降低显存需求。此前Gemma 3 27B模型显存需求高达54GB,经int4量化后锐减至14.1GB,12B模型从24GB降至6.6GB,1B模型仅需0.5GB。这使得普通硬件如RTX 3090显卡和RTX 4060 Laptop GPU能流畅运行,甚至手机也能支持小型模型。量化过程中,谷歌采用QAT技术,在训练中模拟低精度运算,确保模型压缩后仍保持高准确性,困惑度下降了54%。目前,Ollama、LM Studio和llama.cpp等平台已集成该模型,用户可通过Hugging Face和Kaggle获取官方int4和Q4_0版本,Apple Silicon和CPU亦可运行。Gemmaverse社区提供更多量化选项,满足多样化需求。
原文链接
本文链接:https://kx.umi6.com/article/17457.html
转载请注明文章出处
相关推荐
.png)
换一换
27B 显存需求 54 → 14.1GB:谷歌发布 Gemma 3 QAT AI 模型,RTX 3090 显卡可运行
2025-04-19 10:40:22
估值翻倍用时约 15 个月:法 AI 企业 Mistral 新融资轮中估值达 120 亿欧元
2025-09-05 12:18:29
习近平向2025世界智能产业博览会致贺信
2025-09-05 10:23:48
纽约联储调查:人工智能应用加速扩张,但目前对就业影响有限
2025-09-05 00:10:35
美国AI巨头Anthropic全球封杀中国控股公司!无论何地一律禁用Claude等
2025-09-05 18:23:30
蚂蚁国际推出 AI 智能体支付解决方案,可识别用户支付意图、全流程追溯询证
2025-09-05 15:20:28
AI生成苹果Metal内核,PyTorch推理速度提升87%
2025-09-05 11:17:03
OpenAI今年预计通过ChatGPT实现近100亿美元收入
2025-09-06 10:33:35
新华三集团与重庆水务环境集团签订战略合作协议
2025-09-06 10:33:40
不寒而栗!AI克隆盗用别人声音 去卖不可描述保健品
2025-09-05 17:23:07
OpenAI杀入招聘市场:打造AI技能认证体系+人才对接平台
2025-09-05 06:12:15
柯洁回应与AI下棋:比一百盘被虐一百盘 AI要我水平低的数据是在污染自己
2025-09-07 09:43:21
AI 的下一个战场:小模型崛起
2025-09-05 21:26:34
462 文章
173264 浏览
24小时热文
更多

-
2025-09-07 21:49:50
-
2025-09-07 20:50:36
-
2025-09-07 20:49:25