吞吐提升 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

训练MoE足足提速70%！华为只用了3招

标题：训练MoE提速70%！华为的三大优化策略正文： Scaling Law推动下，MoE成为各大模型厂商扩展能力的关键工具。然而，MoE在提升参数规模的同时，也带来了训练效率低下的问题，甚至一半以上的时间浪费在“等待”上。华为推出了名为Adaptive Pipe & EDPB的...

原文链接

智慧轨迹

06-03 15:58:16

MoE

华为优化方案

训练吞吐提升

分享至

打开微信扫一扫

内容投诉

生成图片

13.8倍吞吐提升！浙大上海AI Lab等提出视觉生成新范式，从“下一个token”到“下一个邻域”

标题：13.8倍吞吐提升！浙大上海AI Lab提出视觉生成新范式：从“下一个token”到“下一个邻域” 正文： 13.8倍吞吐提升！浙大上海AI Lab等提出视觉生成新范式，从“下一个token”到“下一个邻域” 在图像/视频生成任务中，传统的“下一个token预测”方法正面临效率瓶颈。为此，浙...

原文链接