3月10日,字节跳动豆包大模型团队宣布开源一项针对MoE架构的优化技术COMET,该技术可将大模型训练效率提升1.7倍,成本节省40%。COMET已应用于字节的万卡集群训练,累计节省数百万GPU小时。此前,豆包团队发布的UltraMem稀疏架构已大幅降低模型推理成本。目前,COMET的核心代码已开源,并计划兼容Triton等编译生态。
原文链接
本文链接:https://kx.umi6.com/article/15178.html
转载请注明文章出处
相关推荐
换一换
字节跳动最新思考模型将于4月17日供用户体验 单位推理成本相比DeepSeek R1降低50%
2025-04-14 12:33:19
消息称字节跳动发力人形机器人领域,月薪可达 12 万元
2025-11-05 12:04:49
两天狂赚5万多:字节Seedance 2.0海外倒号已成暴利风口
2026-02-13 14:23:47
小米应用商店与字节跳动旗下一站式AI Agent开发平台扣子达成合作
2025-08-01 17:05:39
字节启动Top Seed大模型人才招募
2025-04-27 18:24:23
徐新上车了:买了字节跳动老股
2025-11-21 18:35:27
字节跳动辟谣:与芯原股份并无AI芯片相关合作
2025-08-20 16:22:32
字节对大模型方向加码期权激励 核心技术员工最高可获百万元
2025-09-03 15:50:37
字节跳动:AI开发工具TRAE月活已超百万
2025-06-12 14:38:12
字节跳动开源 Deep Research 项目 DeerFlow:可生成图文报告、语音播客
2025-05-10 21:11:54
字节突然开源Seed-OSS,512K上下文主流4倍长度,推理能力刷纪录
2025-08-21 14:33:12
字节跳动发布图像编辑模型 SeedEdit 3.0,处理更加丝滑高效
2025-06-06 16:37:39
字节这款 AI 应用,在海外悄悄「爆了」
2025-10-22 10:43:14
690 文章
613341 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41