10月6日,华为苏黎世计算系统实验室开源全新AI量化技术SINQ(Sinkhorn归一化量化),可将大语言模型显存占用削减60%-70%,单张RTX 4090显卡即可完成此前需A100的任务。SINQ采用双轴采样和Sinkhorn归一化算法,无需复杂校准,显著提升压缩效率与模型精度。测试显示,其性能优于RTN、HQQ等主流免校准方法,接近校准方案水平,同时量化速度比HQQ快2倍、比AWQ快30倍以上。代码已通过Apache 2.0许可证在GitHub和Hugging Face开放,支持免费使用与商业化部署。
原文链接
本文链接:https://kx.umi6.com/article/26303.html
转载请注明文章出处
相关推荐
换一换
华为发布Flex:ai AI容器技术 实现单卡同时承载多个AI工作负载
2025-11-21 15:31:39
NVIDIA黄仁勋:低估华为实在太愚蠢
2025-11-12 12:01:36
余承东被任命为华为公司IRB主任
2025-09-29 21:15:03
消息称华为将发布 AI 领域突破性技术,有望解决算力资源利用效率难题
2025-11-16 15:38:04
以软件补硬件:华为定档 11 月 21 日发布并开源创新 AI 容器技术 Flex:ai
2025-11-19 00:47:08
华为刚投的物理AI:首家国产世界模型公司
2025-11-12 14:04:24
全球首个具身智能本科专业!上海交大公告,联合华为培养,李飞飞高徒带队
2025-11-30 13:09:17
金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案
2025-09-12 21:19:08
黄仁勋:华为是“令人敬畏的科技公司”
2025-07-16 21:13:52
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
中国AI高速路,华为给出开源开放方案
2025-09-24 17:46:56
华为 × 崖州湾国家实验室发布“繁 | 未来农业智能枢纽”:AI 有望让育种流程效率提升 30%
2025-11-11 21:29:02
国产手机卖到1万6!华为新旗舰,搭载麒麟9030
2025-11-25 23:10:46
736 文章
530948 浏览
24小时热文
更多
-
2026-03-10 10:02:35 -
2026-03-10 09:02:22 -
2026-03-10 09:01:12