1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

微软开源“原生1bit”三进制LLM:2B参数,0.4GB内存/单CPU就能跑,性能与同规模全精度开源模型相当。

西风 发自 凹非寺
量子位 | 公众号 QbitAI

微软发布首个开源2B参数规模“原生1bit”LLM——BitNet b1.58 2B4T,单CPU即可运行,性能媲美同规模全精度模型。该模型采用三进制{-1, 0, 1}存储权重,大幅降低显存需求,仅需0.4GB内存。

基于4T token语料训练,BitNet b1.58 2B4T在保持性能的同时,计算效率突出。单CPU可达每秒5-7个token,解码延迟29ms,能耗低至0.028J,适合笔记本电脑及边缘设备实时运行。

BitNet b1.58 2B4T具备原生训练优势,避免了训练后量化模型常见的性能衰减。其采用“absmean”量化方案,将权重映射为三元值,平均每个权重仅需1.58bit。此外,模型还优化了激活函数、位置编码和偏置设计。

在GSM8K数学推理任务中,BitNet以58.38%的准确率优于Llama 3.2-1B(38.21%)和Qwen2.5-1.5B(56.79%),并在WinoGrande常识推理任务中得分71.90,超越同类模型均值(63.55%)。

微软通过BitNet b1.58 2B4T展示了1bit LLM的强大潜力,并开源了针对GPU和CPU的专用推理库,包括自定义CUDA内核和C++库bitnet.cpp。这一成果为低功耗AI应用提供了新方向。

原文链接
本文链接:https://kx.umi6.com/article/17513.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
微软下一代AI芯片或由英特尔代工
2025-10-20 13:06:13
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
消息称微软 2025 财年财报掩盖投资 OpenAI 亏损,周三有可能公开情况
2025-10-27 22:17:35
英国前首相苏纳克加入微软和Anrowpic担任高级顾问
2025-10-11 10:41:15
自动截图玩家游戏画面训练AI 微软否认:只是为了识别
2025-10-26 18:22:58
还要玩家干什么!微软探索新方案:开发AI可代打Xbox游戏
2026-03-04 15:52:33
两个月斩获微软四笔订单 “英版甲骨文”或计划明年IPO
2025-10-16 00:43:21
微软承认Win11部分AI功能失败:将简化或删除 但不会放弃
2026-02-01 23:04:51
云业务助微软Q3业绩超预期 但创纪录资本支出成市场阴影
2025-10-30 08:32:56
微软与沙特签署主权云服务相关谅解备忘录
2025-11-20 13:27:40
自研 AI 芯片进展缓慢,微软 CEO 纳德拉计划借“OpenAI 之力”推进研发
2025-11-13 08:48:58
用AI代码替换Windows里每一行C/C++!微软回应了
2025-12-25 22:00:44
投行韦德布什力挺AI浪潮:押注微软和英伟达等十大科技股
2025-11-25 22:11:48
24小时热文
更多
扫一扫体验小程序