大模型压缩 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

上交大冷静文：模型发展需要和芯片、系统厂商协同

标题：上交大冷静文：模型发展需芯片与系统协同近期，上海交通大学与魔形智能联合研究团队在 HPCA 2025 会议上发表论文《VQ-LLM: High-performance Code Generation for Vector Quantization Augmented LLM Infere...

原文链接

WisdomTrail

04-30 20:26:59

向量量化

国产芯片

大模型压缩

分享至

打开微信扫一扫

内容投诉

生成图片

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强压缩工具包来了近期，Llama-3.1登顶开源领域，其405B版本模型对资源提出了更高要求，高达900多GB的内存需求。为应对这一挑战，北航、商汤、南洋理工等团队联手研发出大模型压缩工具与基准LLMC，使一张80G A100显卡就能完成L...

原文链接