1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月6日,华为苏黎世计算系统实验室开源全新AI量化技术SINQ(Sinkhorn归一化量化),可将大语言模型显存占用削减60%-70%,单张RTX 4090显卡即可完成此前需A100的任务。SINQ采用双轴采样和Sinkhorn归一化算法,无需复杂校准,显著提升压缩效率与模型精度。测试显示,其性能优于RTN、HQQ等主流免校准方法,接近校准方案水平,同时量化速度比HQQ快2倍、比AWQ快30倍以上。代码已通过Apache 2.0许可证在GitHub和Hugging Face开放,支持免费使用与商业化部署。

原文链接
本文链接:https://kx.umi6.com/article/26303.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
值得买:与华为的合作目前已取得几项重要成果
2025-10-27 10:57:33
奥迪+华为=油车智能天花板?
2025-12-20 21:04:55
时隔5年 任正非再次与上海交大校长会面
2025-07-23 13:51:33
中国最强科技公司!黄仁勋为何又力挺华为:计算、网络技术等强到可怕
2025-05-02 08:54:03
华为的「荣耀」
2025-10-30 15:47:28
华为、阿里押注“超节点”:不卷单卡性能 追求“系统效率”才是国产AI正解?
2025-10-04 09:59:02
每2秒吃透一道高数大题!华为终于揭秘准万亿MoE昇腾训练系统全流程
2025-05-30 16:54:34
NVIDIA黄仁勋:低估华为实在太愚蠢
2025-11-12 12:01:36
中国AI芯片市场迎巨变:英伟达2026年将仅占8%
2025-12-05 12:26:55
华为发布AI推理技术UCM:降低HBM依赖 计划9月正式开源
2025-08-13 08:39:18
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
2025-07-10 23:28:33
华为、清华大学合作打造首个园区网络智能体:17 万终端全方位覆盖,一句话定位问题、自动优化 Wi-Fi
2025-05-07 19:16:32
华为兑现了五年前的阳谋
2025-05-10 07:02:28
24小时热文
更多
扫一扫体验小程序