2月4日,腾讯混元AI Infra团队开源高性能LLM推理核心算子库HPC-Ops。在真实场景下,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能方面,HPC-Ops的Attention较FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM较DeepGEMM最高提升1.88倍,FusedMoE较TensorRT-LLM最高提升1.49倍。该技术开源为行业提供生产级解决方案,显著优化推理效率,展现技术领先性与实用性。
原文链接
本文链接:https://kx.umi6.com/article/32602.html
转载请注明文章出处
相关推荐
换一换
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
腾讯混元 Voyager3D 世界模型发布,可生成长距离、世界一致的漫游场景
2025-09-02 17:35:42
腾讯混元将发布原生多模态图像生成模型
2025-09-10 07:30:08
腾讯混元自研深度思考模型「T1」正式发布
2025-03-21 23:47:21
腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿
2024-12-03 16:29:24
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
2025-04-23 18:07:16
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
华科校友在港冲刺AI infra第一股!中国最能赚的独立边缘云服务商,王小川投了
2025-06-25 17:48:13
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
2025-07-07 21:37:43
90后教授带队,潞晨科技刚刚融资第五轮
2024-10-09 11:49:12
关于 AI Infra 的一切
2025-08-11 19:08:22
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
腾讯混元大模型品牌 Hunyuan 更名为 HY
2025-12-10 15:53:58
717 文章
632702 浏览
24小时热文
更多
-
2026-06-08 07:13:40 -
2026-06-07 23:56:41 -
2026-06-07 21:50:41