1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

4月18日,谷歌发布Gemna 3 QAT AI模型,通过量化感知训练显著降低显存需求。此前Gemma 3 27B模型显存需求高达54GB,经int4量化后锐减至14.1GB,12B模型从24GB降至6.6GB,1B模型仅需0.5GB。这使得普通硬件如RTX 3090显卡和RTX 4060 Laptop GPU能流畅运行,甚至手机也能支持小型模型。量化过程中,谷歌采用QAT技术,在训练中模拟低精度运算,确保模型压缩后仍保持高准确性,困惑度下降了54%。目前,Ollama、LM Studio和llama.cpp等平台已集成该模型,用户可通过Hugging Face和Kaggle获取官方int4和Q4_0版本,Apple Silicon和CPU亦可运行。Gemmaverse社区提供更多量化选项,满足多样化需求。

原文链接
本文链接:https://kx.umi6.com/article/17457.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
27B 显存需求 54 → 14.1GB:谷歌发布 Gemma 3 QAT AI 模型,RTX 3090 显卡可运行
2025-04-19 10:40:22
干家务一小时挣1000元,具身智能时代人类新岗位
2025-10-24 12:34:34
肖远企:目前AI在金融领域的应用仍处于早期阶段 无法取代人的决策
2025-10-23 16:12:32
ChatGPT 涉嫌“诱导”美国 16 岁少年自杀,家属指控 OpenAI 事发前放松安全措施
2025-10-24 15:41:04
荣耀设立20亿激励资源 提升智能体和MagicOS生态体验力度
2025-10-23 18:14:34
诺基亚CEO:目前仍处于AI超级周期的早期阶段,就像90年代的互联网
2025-10-23 20:15:12
OPPO与蚂蚁集团签署战略合作 将共建AI智能体等
2025-10-24 12:40:26
百亿参数人类基因组通用基础模型发布
2025-10-23 20:16:19
PCB业绩浪来袭!热度传导至上游 扩产潮下谁将受益?
2025-10-25 15:31:36
斯坦福、哈佛等最新研究:AI 聊天机器人比人类更善于“奉承”
2025-10-25 10:17:38
“996”都算偷懒?硅谷AI精英化身“卷王”:每周狂干100小时!
2025-10-24 11:37:10
具身智能落地茶颜悦色,“新店员”刷屏了
2025-10-24 16:46:05
云计算“活教科书”语出惊人,指明程序员的进化方向
2025-10-24 16:43:46
24小时热文
更多
扫一扫体验小程序