1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

10月6日,华为苏黎世计算系统实验室开源全新AI量化技术SINQ(Sinkhorn归一化量化),可将大语言模型显存占用削减60%-70%,单张RTX 4090显卡即可完成此前需A100的任务。SINQ采用双轴采样和Sinkhorn归一化算法,无需复杂校准,显著提升压缩效率与模型精度。测试显示,其性能优于RTN、HQQ等主流免校准方法,接近校准方案水平,同时量化速度比HQQ快2倍、比AWQ快30倍以上。代码已通过Apache 2.0许可证在GitHub和Hugging Face开放,支持免费使用与商业化部署。

原文链接
本文链接:https://kx.umi6.com/article/26303.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
NVIDIA黄仁勋:低估华为实在太愚蠢
2025-11-12 12:01:36
华为启动全球教育医疗伙伴联盟,倡议推动 AI 诊疗商业模式落地
2025-07-10 23:28:33
华为 × 云南交投发布“绿美通道・交通大模型”,实现通用与智能算力融合升级
2025-07-16 07:56:47
华为面向医疗领域发布 AI 数据平台,涵盖知识生成与检索等
2025-12-07 18:40:26
金山办公与华为联合发布 WPS 365 一体化 AI 办公解决方案
2025-09-12 21:19:08
华为兑现了五年前的阳谋
2025-05-10 07:02:28
华为发布AI数据湖解决方案,助力企业加速拥抱AI
2025-05-14 12:12:54
徐工集团董事长杨东升拜会华为公司创始人任正非
2025-11-07 09:46:31
华为、清华大学合作打造首个园区网络智能体:17 万终端全方位覆盖,一句话定位问题、自动优化 Wi-Fi
2025-05-07 19:16:32
徐直军:华为对为人工智能发展提供充裕算力充满信心
2025-09-18 15:57:24
黄仁勋:任何轻视华为和中国制造的人都极其天真
2025-07-16 17:11:28
传华为计划重新设计AI芯片:ASIC转向GPGPU 正面硬罡NVIDIA
2025-07-12 13:53:16
报告:华为2026年将占据中国AI芯片市场50%份额
2025-12-04 18:36:56
24小时热文
更多
扫一扫体验小程序