1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2月4日,腾讯混元AI Infra团队开源高性能LLM推理核心算子库HPC-Ops。在真实场景下,混元模型推理QPM提升30%,DeepSeek模型QPM提升17%。单算子性能方面,HPC-Ops的Attention较FlashInfer/FlashAttention最高提升2.22倍,GroupGEMM较DeepGEMM最高提升1.88倍,FusedMoE较TensorRT-LLM最高提升1.49倍。该技术开源为行业提供生产级解决方案,显著优化推理效率,展现技术领先性与实用性。

原文链接
本文链接:https://kx.umi6.com/article/32602.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
真正面向大模型的AI Infra,必须同时懂模型、系统、产业|商汤大装置宣善明@MEET2026
2025-12-22 10:35:49
腾讯混元 Voyager3D 世界模型发布,可生成长距离、世界一致的漫游场景
2025-09-02 17:35:42
腾讯混元将发布原生多模态图像生成模型
2025-09-10 07:30:08
腾讯混元自研深度思考模型「T1」正式发布
2025-03-21 23:47:21
腾讯混元大模型上线并开源文生视频能力:支持中英文双语输入,参数量 130 亿
2024-12-03 16:29:24
腾讯混元 3D 生成模型升级 2.5 版本:建模精细度提升,免费生成额度翻倍
2025-04-23 18:07:16
给大模型生图“去油”,腾讯混元新研究 SRPO 公布
2025-09-17 21:36:40
华科校友在港冲刺AI infra第一股!中国最能赚的独立边缘云服务商,王小川投了
2025-06-25 17:48:13
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
2025-07-07 21:37:43
90后教授带队,潞晨科技刚刚融资第五轮
2024-10-09 11:49:12
关于 AI Infra 的一切
2025-08-11 19:08:22
持续拥抱开源 腾讯混元一口气开源四款小尺寸模型 最小仅0.5B
2025-08-04 18:06:55
腾讯混元大模型品牌 Hunyuan 更名为 HY
2025-12-10 15:53:58
24小时热文
更多
扫一扫体验小程序