
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
微软发布BitNet v2框架,实现1 bit LLM的原生4 bit激活值量化,以充分利用新一代GPU(如GB200)的4 bit计算能力,减少内存带宽并提升计算效率。此前,微软的BitNet b1.58将权重量化至1.58-bit,但激活值仍为8-bit,无法充分发挥硬件潜力。此次研究针对注意力...
原文链接
加载更多

暂无内容