1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当。

西风 发自 凹非寺
量子位 | 公众号 QbitAI

微软发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU即可运行,性能媲美同规模全精度模型。该模型采用三进制{-1, 0, 1}存储权重,大幅降低显存需求,仅需0.4GB内存。

基于4T token语料训练,BitNet b1.58 2B4T在保持性能的同时,计算效率突出。单CPU可达每秒5-7个token,解码延迟29ms,能耗低至0.028J,适合笔记本电脑及边缘设备实时运行。

BitNet b1.58 2B4T具备原生训练优势,避免了训练后量化模型常见的性能衰减。其采用“absmean”量化方案,将权重映射为三元值,平均每个权重仅需1.58bit。此外,模型还优化了激活函数、位置编码和偏置设计。

在GSM8K数学推理任务中,BitNet以58.38%的准确率优于Llama 3.2-1B(38.21%)和Qwen2.5-1.5B(56.79%),并在WinoGrande常识推理任务中得分71.90,超越同类模型均值(63.55%)。

微软通过BitNet b1.58 2B4T展示了1bit LLM的强大潜力,并开源了针对GPU和CPU的专用推理库,包括自定义CUDA内核和C++库bitnet.cpp。这一成果为低功耗AI应用提供了新方向。

原文链接
本文链接:https://kx.umi6.com/article/17513.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
Anthropic正式发布最新的模型Claude Opus 4.5
2025-11-25 03:27:56
微软正探索与人工智能初创公司达成交易 以为“后OpenAI时代”做准备
2026-05-14 04:18:21
微软宣布其首个自研图像生成模型 MAI-Image-1 已整合入 Bing 与 Copilot,逐步减少对 OpenAI 的依赖
2025-11-05 09:58:04
微软前副总裁炮轰:微软已错失AI浪潮 正重蹈互联网与移动时代的覆辙
2026-05-18 12:34:23
微软或将与Kimi进行Agent级合作 实现Office产品自动化
2025-12-18 14:58:28
使用量一直难突破,微软出奇招邀请网红拍短视频为 Copilot“带货”
2025-11-11 12:05:31
微软宣布组建超级智能团队,自研 AI 模型摆脱对 OpenAI 的依赖
2025-11-06 23:18:30
马斯克向OpenAI和微软索赔最高达1340亿美元
2026-01-18 15:28:06
Win11将魔改为AI OS引网友不满:微软直接禁止评论
2025-11-14 23:21:25
微软下一代AI芯片或由英特尔代工
2025-10-20 13:06:13
微软组建超级智能团队 聚焦医疗诊断等领域
2025-11-07 00:25:07
LLM能替代数据科学家了?DeepAnalyze帮你告别手动分析数据
2025-11-01 13:29:57
24小时热文
更多
扫一扫体验小程序