2025-04-21 12:38:13
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当
阅读:1094
微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当。
西风 发自 凹非寺
量子位 | 公众号 QbitAI
微软发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU即可运行,性能媲美同规模全精度模型。该模型采用三进制{-1, 0, 1}存储权重,大幅降低显存需求,仅需0.4GB内存。
基于4T token语料训练,BitNet b1.58 2B4T在保持性能的同时,计算效率突出。单CPU可达每秒5-7个token,解码延迟29ms,能耗低至0.028J,适合笔记本电脑及边缘设备实时运行。
BitNet b1.58 2B4T具备原生训练优势,避免了训练后量化模型常见的性能衰减。其采用“absmean”量化方案,将权重映射为三元值,平均每个权重仅需1.58bit。此外,模型还优化了激活函数、位置编码和偏置设计。
在GSM8K数学推理任务中,BitNet以58.38%的准确率优于Llama 3.2-1B(38.21%)和Qwen2.5-1.5B(56.79%),并在WinoGrande常识推理任务中得分71.90,超越同类模型均值(63.55%)。
微软通过BitNet b1.58 2B4T展示了1bit LLM的强大潜力,并开源了针对GPU和CPU的专用推理库,包括自定义CUDA内核和C++库bitnet.cpp。这一成果为低功耗AI应用提供了新方向。
原文链接
本文链接:https://kx.umi6.com/article/17513.html
转载请注明文章出处
相关推荐
换一换
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
Anthropic正式发布最新的模型Claude Opus 4.5
2025-11-25 03:27:56
微软正探索与人工智能初创公司达成交易 以为“后OpenAI时代”做准备
2026-05-14 04:18:21
微软宣布其首个自研图像生成模型 MAI-Image-1 已整合入 Bing 与 Copilot,逐步减少对 OpenAI 的依赖
2025-11-05 09:58:04
微软前副总裁炮轰:微软已错失AI浪潮 正重蹈互联网与移动时代的覆辙
2026-05-18 12:34:23
微软或将与Kimi进行Agent级合作 实现Office产品自动化
2025-12-18 14:58:28
使用量一直难突破,微软出奇招邀请网红拍短视频为 Copilot“带货”
2025-11-11 12:05:31
微软宣布组建超级智能团队,自研 AI 模型摆脱对 OpenAI 的依赖
2025-11-06 23:18:30
马斯克向OpenAI和微软索赔最高达1340亿美元
2026-01-18 15:28:06
Win11将魔改为AI OS引网友不满:微软直接禁止评论
2025-11-14 23:21:25
微软下一代AI芯片或由英特尔代工
2025-10-20 13:06:13
微软组建超级智能团队 聚焦医疗诊断等领域
2025-11-07 00:25:07
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
2025-11-01 13:29:57
737 文章
673016 浏览
24小时热文
更多
-
2026-06-09 07:06:40 -
2026-06-09 00:54:40 -
2026-06-09 00:53:08