8月14日,字节跳动Seed团队发布并开源全模态PyTorch原生训练框架VeOmni。该框架采用以模型为中心的分布式训练方案,大幅降低工程开销,将数周的开发时间缩短至几天。相比传统框架如Megatron-LM需要一周以上研发,VeOmni仅需一天即可完成模型代码构建并开启训练任务,工程耗时压缩90%以上。实验显示,基于VeOmni,300亿参数的全模态MoE模型在128张卡上训练吞吐量超2800 tokens/sec/GPU,并支持160K超长上下文序列。目前论文与代码已公开,GitHub Star数超500。
原文链接
本文链接:https://kx.umi6.com/article/23595.html
转载请注明文章出处
相关推荐
.png)
换一换
字节和DeepSeek争抢“天才少年”
2025-03-29 17:52:58
阿里开源全模态大模型Qwen3-Omni 可像人类一样听说写
2025-09-24 16:50:21
字节快手,AI视频「狭路又相逢」
2025-04-16 15:05:21
字节调整AI部门Seed,刚从Gemini加盟的吴永辉成新负责人
2025-02-21 14:55:39
字节跳动豆包新版深度思考开启测试,支持边想边搜
2025-03-28 10:38:32
字节跳动辟谣:与芯原股份并无AI芯片相关合作
2025-08-20 16:22:32
字节跳动扣子 Coze 宣布开源:采用 Apache 2.0 许可证,支持商用
2025-07-26 15:40:54
字节、OpenAI加速AI智能体热潮,英伟达合作方认为2028年超84%将是AI应用
2025-01-26 13:11:28
字节跳动公开向量模型Seed1.5-Embedding
2025-05-12 13:35:17
字节跳动展示 OmniHuman 多模态框架:图片 + 音频 = 逼真动画,半身全身均可生成
2025-02-06 15:33:56
字节跳动 OmniHuman 多模态视频生成模型即将上线,图片 + 音频便可生成视频
2025-02-07 18:02:50
百度推出真·AI相机,拍照存储管理一步到位
2025-06-11 17:13:54
字节跳动将对Seed部门大模型技术人员增发期权
2025-09-03 12:45:43
564 文章
262071 浏览
24小时热文
更多

-
2025-10-24 05:23:38
-
2025-10-24 03:21:23
-
2025-10-24 01:20:07