
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
近日,字节跳动豆包大模型团队与香港大学合作,提出了HybridFlow框架,该框架能显著提升强化学习(RL)和基于人类反馈的强化学习(RLHF)的训练吞吐量,并降低开发和维护复杂度。实验显示,HybridFlow在不同模型规模和算法下的...
原文链接
【新闻摘要】11月3日,字节跳动豆包大模型团队与香港大学联合发布并开源了全新RLHF框架——HybridFlow(开源项目名:veRL)。该框架兼容多种训练和推理框架,支持灵活的模型部署及多种强化学习(RL)算法实现。采用混合编程模型,结合单控制器的灵活性与多控制器的高效性,显著提升了训练吞吐量,降低了开发和维护复杂度。实验结果显示,HybridFlow在不同模型规模和算法下,训练吞吐量相比其他框架提升了1.5倍至20倍。目前,该论文已被EuroSys 2025接收,并公开了代码仓库。
(摘要共计227字)
原文链接
加载更多

暂无内容