Zyphra于8月27日发布新AI模型Zamba2-mini,拥有12亿参数,在4bit量化下内存占用仅700MB,成为端侧小语言模型中的佼佼者。这款模型在推理任务中的表现尤为出色,首次令牌时间较前代模型缩短一半,内存占用减少27%,性能超越了包括谷歌Gemma-2B、Huggingface的SmolLM-1.7B、苹果的OpenELM-1.1B和微软的Phi-1.5在内的大模型。Zamba2-mini通过优化架构,结合不同神经网络设计的优势,实现了高质量输出与高效运行的平衡。相较于前代产品,Zamba2-mini在共享注意力层的集成和旋转位置嵌入的引入上实现了性能提升。此模型在预训练时使用了包含三万亿个token的海量数据集,并经过严格过滤和处理,最终在1000亿个高质量tokens上完成退火训练。Zyphra已承诺将其作为Apache 2.0许可下的开源模型提供给公众使用。
原文链接
本文链接:https://kx.umi6.com/article/5605.html
转载请注明文章出处
相关推荐
换一换
最强端侧开源 AI 模型 Zamba2-mini 登场:12 亿参数,4bit 量化下内存占用小于 700MB
2024-08-29 16:27:21
千问APP独家冠名“四大卫视”春晚
2026-02-03 11:36:37
内存涨完硬盘涨,等等党这波是彻底输麻了
2026-02-03 02:10:19
大模型API的大众点评来了:7×24小时实测,毫秒级延迟智能路由,选API必备
2026-02-02 12:33:55
阶跃星辰发布开源基座模型Step 3.5 Flash
2026-02-02 10:30:52
收入暴降70%!翻译成第一批被AI取代的工作 从业者:干这活如自掘坟墓
2026-02-03 14:42:20
百芯大战
2026-02-03 02:10:09
寒武纪盘中大幅跳水 公司回应:不清楚具体原因 市场很多传闻都是假的
2026-02-03 13:38:34
万联易达成立产业人工智能研究与应用专家委员会,实现产研双向奔赴
2026-02-02 16:48:52
千问APP春节攻势继续,独家冠名“四大卫视”春晚
2026-02-03 15:42:39
上海:在集成电路、生物医药、人工智能等领域加快实施一批重大产业项目 积极支持智能网联新能源汽车、航空航天、卫星互联网等产业发展
2026-02-03 10:31:59
独家I松应科技连续完成 Pre-A、Pre-A+ 轮融资
2026-02-02 09:28:35
Palantir美股盘前涨近12%
2026-02-03 17:50:50
677 文章
457430 浏览
24小时热文
更多
-
2026-02-03 18:54:03 -
2026-02-03 18:53:07 -
2026-02-03 18:52:58