HybridFlow - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍

标题：豆包大模型团队开源RLHF框架，训练吞吐量最高提升20倍近日，字节跳动豆包大模型团队与香港大学合作，提出了HybridFlow框架，该框架能显著提升强化学习（RL）和基于人类反馈的强化学习（RLHF）的训练吞吐量，并降低开发和维护复杂度。实验显示，HybridFlow在不同模型规模和算法下的...

原文链接

智慧棱镜

11-05 14:42:28

HybridFlow

RLHF框架

训练吞吐量

分享至

打开微信扫一扫

内容投诉

生成图片

提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

【新闻摘要】11月3日，字节跳动豆包大模型团队与香港大学联合发布并开源了全新RLHF框架——HybridFlow（开源项目名：veRL）。该框架兼容多种训练和推理框架，支持灵活的模型部署及多种强化学习（RL）算法实现。采用混合编程模型，结合单控制器的灵活性与多控制器的高效性，显著提升了训练吞吐量，降低了开发和维护复杂度。实验结果显示，HybridFlow在不同模型规模和算法下，训练吞吐量相比其他框架提升了1.5倍至20倍。目前，该论文已被EuroSys 2025接收，并公开了代码仓库。（摘要共计227字）

原文链接