微软开源了一款名为BitNet b1.58的大模型推理框架,这一框架将传统16位浮点数模型参数压缩成三进制{-1, 0, 1},每个参数只需1.58位信息表示。这使得模型在保持一定精度的同时,大幅减少了存储空间和计算资源需求,甚至能在单个CPU上运行千亿参数模型,速度达到每秒5-7个token。
该框架被称为1bit大模型推理框架,已在GitHub上收获7.9k星标。BitNet b1.58不仅在计算效率上有所突破,还显著降低了能耗。在ARM CPU上,性能提升了1.37至5.07倍,能耗降低55.4%至70.0%;而在x86 CPU上,加速效果为2.37至6.17倍,能耗减少71.9%至82.2%。
微软的研究团队在一年前就开始探索1bit大模型,并在近期发布的BitNet b1.58中增加了0值,从而更好地平衡精度与计算效率。这项技术的关键在于将模型权重量化为三元值{-1, 0, 1},并采用特定的量化函数来约束权重。BitNet b1.58在矩阵乘法方面的能耗节省了71.4倍。
尽管这项技术前景广阔,但需要从头开始训练模型,成本较高。Huggingface最近整合了BitNet b1.58,通过一些技巧使现有模型可以直接微调到1.58bit,降低了应用门槛。然而,这一技术仍有局限性,需要在实践中进一步验证其实际效果。
原文链接
本文链接:https://kx.umi6.com/article/7673.html
转载请注明文章出处
相关推荐
换一换
微软推广 Copilot AI 遇冷,评论区成大型吐槽现场
2025-11-21 11:14:52
微软自研AI芯片遇阻:计划借力OpenAI技术实现突围
2025-11-13 09:52:43
微软为 Copilot 添加动画形象,提升 AI 助手交互亲和力
2025-10-01 09:40:13
微软宣布其首个自研图像生成模型 MAI-Image-1 已整合入 Bing 与 Copilot,逐步减少对 OpenAI 的依赖
2025-11-05 09:58:04
OpenAI走向“算力帝国”
2025-09-22 18:02:48
微软借旗下 iOS 应用更新日志推广 Copilot:标注“由 AI 生成”
2025-12-15 09:26:50
英国前首相苏纳克加入微软和Anrowpic担任高级顾问
2025-10-11 10:41:15
微软否认下调 AI 销售指标,增长目标≠销售配额
2025-12-05 10:18:06
特朗普点名微软:不能让电费上涨
2026-01-13 15:42:36
微软宣布增加对加拿大AI投资力度 未来两年将投入超75亿加元
2025-12-09 19:56:02
微软出奇招:让美国网红带货AI产品 Copilot瞄准年轻消费者
2025-11-10 23:37:34
为 AI“降温”:微软亮出散热王牌 HXU,性能提升 100%、支持 240kW 机架功率
2025-10-15 10:37:06
突发!微软与OpenAI同日开火:语音之战+通用大模型,AI霸权决战打响
2025-08-30 11:49:23
686 文章
467044 浏览
24小时热文
更多
-
2026-01-23 09:43:53 -
2026-01-23 08:40:41 -
2026-01-23 06:34:26