1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月6日,华为苏黎世计算系统实验室开源全新AI量化技术SINQ(Sinkhorn归一化量化),可将大语言模型显存占用削减60%-70%,单张RTX 4090显卡即可完成此前需A100的任务。SINQ采用双轴采样和Sinkhorn归一化算法,无需复杂校准,显著提升压缩效率与模型精度。测试显示,其性能优于RTN、HQQ等主流免校准方法,接近校准方案水平,同时量化速度比HQQ快2倍、比AWQ快30倍以上。代码已通过Apache 2.0许可证在GitHub和Hugging Face开放,支持免费使用与商业化部署。

原文链接
本文链接:https://kx.umi6.com/article/26303.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
消息称华为即将发布 AI 推理领域突破性成果:降低对 HBM 依赖,提升国内大模型性能
2025-08-10 09:43:09
华为发布盘古大模型5.5
2025-06-20 17:09:56
人形机器人:下一个万亿市场,华为、宇树、特斯拉已布局
2025-02-12 15:33:08
华为:2035年全社会的算力总量将增长10万倍
2025-09-17 09:28:35
英伟达黄仁勋称华为是全球最强科技公司之一,中美在 AI 发展领域的水平非常接近
2025-05-01 16:29:14
华为推出 DeepSeek 训 / 推超融合一体机,适配 V3&R1 及蒸馏模型
2025-02-17 10:47:33
郭平:华为要成为世界AI算力的第二选择或另一个选择!目标比肩美国
2025-08-31 13:03:00
金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案
2025-09-12 21:19:08
华为模型训练和车辆控制专利公布 可应用于AI领域
2025-02-19 15:56:20
黄仁勋:中国的AI市场无论有没有英伟达都会进步 与华为是竞争对手不是敌人
2025-07-21 05:12:10
时隔多年,AI芯片又是华为发布会主角了
2025-09-19 11:09:57
中国AI高速路,华为给出开源开放方案
2025-09-24 17:46:56
华为、阿里押注“超节点”:不卷单卡性能 追求“系统效率”才是国产AI正解?
2025-10-04 09:59:02
24小时热文
更多
扫一扫体验小程序