
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
微软开源了一款名为BitNet b1.58的大模型推理框架,这一框架将传统16位浮点数模型参数压缩成三进制{-1, 0, 1},每个参数只需1.58位信息表示。这使得模型在保持一定精度的同时,大幅减少了存储空间和计算资源需求,甚至能在单个CPU上运行千亿参数模型,速度达到每秒5-7个token。
该...
原文链接
加载更多

暂无内容