2月4日,腾讯混元AI Infra团队开源高性能LLM推理核心算子库HPC-Ops。在真实场景下,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能方面,HPC-Ops的Attention较FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM较DeepGEMM最高提升1.88倍,FusedMoE较TensorRT-LLM最高提升1.49倍。该技术开源为行业提供生产级解决方案,显著优化推理效率,展现技术领先性与实用性。
原文链接
本文链接:https://kx.umi6.com/article/32602.html
转载请注明文章出处
相关推荐
换一换
华科校友在港冲刺AI infra第一股!中国最能赚的独立边缘云服务商,王小川投了
2025-06-25 17:48:13
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
Agent狂欢下的冷思考
2025-08-13 15:39:12
90后教授带队,潞晨科技刚刚融资第五轮
2024-10-09 11:49:12
腾讯混元 T1-Vision 上线元宝:可深度理解图片内容
2025-05-12 21:40:45
刚刚,DeepSeek能看懂猫片了!腾讯混元加持
2025-02-21 14:49:03
一张图 + 一句话实现任意角色场景姿势,腾讯混元宣布开源定制化图像生成插件 InstantCharacter
2025-04-18 20:22:57
腾讯混元 Voyager3D 世界模型发布,可生成长距离、世界一致的漫游场景
2025-09-02 17:35:42
当大模型升级速度变缓,AI Infra 创业还是一门「好生意」吗?
2024-11-09 20:56:00
腾讯混元发布并开源图生视频模型:可生成 5 秒短视频,还能自动配上背景音效
2025-03-07 09:57:02
Agent狂欢下的冷思考:为什么说Data&AI数据基础设施,才是AI时代Infra新范式
2025-08-13 13:35:08
让用户无痛开发AI应用,袁进辉新公司获近亿元天使+轮融资 | 36氪首发
2024-07-04 12:29:16
633 文章
415472 浏览
24小时热文
更多
-
2026-02-04 19:00:46 -
2026-02-04 18:00:11 -
2026-02-04 17:59:33