1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:上交大冷静文:模型发展需芯片与系统协同

近期,上海交通大学与魔形智能联合研究团队在 HPCA 2025 会议上发表论文《VQ-LLM: High-performance Code Generation for Vector Quantization Augmented LLM Inference》,提出通过分层代码本缓存和代码本中心计算引擎实现超过 50% 的推理延迟降低,显著提升大语言模型推理效率。

论文负责人冷静文教授指出,向量量化(VQ)相比单元素量化的优势在于更低的比特压缩位宽。冷静文团队聚焦芯片架构和硬件互联,包括数据流设计及超节点高速互联。他强调国产芯片应避免单纯模仿英伟达,需有原创性思考,例如通过数据流芯片设计突破现有瓶颈。

冷静文认为,GPU红利渐尽,未来需创新芯片架构与编程方法。他提到,DeepSeek开源的代码库中,算子生成与多GPU编程有一定借鉴意义,但国产芯片还需构建对标CUDA的编程生态,降低学习门槛。

大集群优化方面,国内尚未拥有英伟达NVLink级别的高速互联,但华为CloudMatrix384超节点在编程生态上有一定助力。针对国产芯片的BF16/FP32收敛问题,冷静文建议加强原创设计和开放生态建设。

未来,芯片、系统与模型厂商需协同推进新型架构设计和模型小型化,共同推动大模型发展。针对英伟达出口限制,国内芯片厂商需注重生态建设和高带宽内存解决方案。

原文链接
本文链接:https://kx.umi6.com/article/18020.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯云:全面适配主流国产芯片
2025-09-16 11:09:10
Deepseek一句话 寒武纪市值超越这些大蓝筹
2025-08-22 16:52:32
爆火的DeepSeek一体机,更多满足的是情绪价值
2025-04-01 14:26:49
国产芯片大战更焦灼了丨智涌分析
2024-07-10 11:47:53
高性能计算电源芯片销售收入同比上升1402% 国产芯片概念股单日逼近20CM涨停 本周机构密集调研相关上市公司
2025-04-13 23:00:45
真够卷的!DeepSeek更完智谱更:GLM-4.6,代码国内最强
2025-09-30 17:30:07
DeepSeek:UE8M0 FP8是针对即将发布的下一代国产芯片设计
2025-08-21 16:42:18
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
2025-08-22 14:48:58
国产模型+国产芯片“蜜月期”开启!DeepSeek、智谱密集上新 华为、寒武纪芯片火速适配
2025-09-30 21:35:35
消息称蚂蚁集团采用阿里、华为等国产芯片训练 AI:性能匹敌英伟达 H800,成本降低 20%
2025-03-24 15:01:24
做难而正确的AI Infra创新——专访国产大模型推理引擎xLLM社区负责人刘童璇
2025-12-02 12:08:01
DeepSeek带飞寒武纪
2025-04-23 12:55:50
上交大冷静文:模型发展需要和芯片、系统厂商协同
2025-04-30 20:26:59
24小时热文
更多
扫一扫体验小程序