2月4日,腾讯混元AI Infra团队开源高性能LLM推理核心算子库HPC-Ops。在真实场景下,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能方面,HPC-Ops的Attention较FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM较DeepGEMM最高提升1.88倍,FusedMoE较TensorRT-LLM最高提升1.49倍。该技术开源为行业提供生产级解决方案,显著优化推理效率,展现技术领先性与实用性。
原文链接
本文链接:https://kx.umi6.com/article/32602.html
转载请注明文章出处
相关推荐
换一换
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
做难而正确的AI Infra创新——专访国产大模型推理引擎xLLM社区负责人刘童璇
2025-12-02 12:08:01
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
2025-08-13 13:35:08
硅基流动完成近亿元天使+轮融资,国产大模型“补足弹药”混战升级
2024-07-06 02:50:32
百度打造「最硬AI云」,硬在哪里?
2025-11-14 16:07:23
腾讯混元发布混元图像3.0图生图模型
2026-01-26 13:11:25
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
2025-04-23 18:07:16
一场由DeepSeek公布利润率引发的“血案”
2025-03-02 18:46:18
腾讯混元3D AI创作引擎正式上线
2025-01-21 15:41:07
让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资 | 36氪首发
2024-07-04 12:29:16
跟上DeepSeek,国内算力要加油
2025-03-04 13:11:27
腾讯混元自研深度思考模型 T1 发布:吐字快、能秒回,擅长超长文处理
2025-03-22 00:49:29
华科校友在港冲刺AI infra第一股!中国最能赚的独立边缘云服务商,王小川投了
2025-06-25 17:48:13
717 文章
634254 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41