提升 1.5~20 倍吞吐量，字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

2024-11-05 14:36:53

AGI探路者

发布在

快讯

阅读：1020

【新闻摘要】11月3日，字节跳动豆包大模型团队与香港大学联合发布并开源了全新RLHF框架——HybridFlow（开源项目名：veRL）。该框架兼容多种训练和推理框架，支持灵活的模型部署及多种强化学习（RL）算法实现。采用混合编程模型，结合单控制器的灵活性与多控制器的高效性，显著提升了训练吞吐量，降低了开发和维护复杂度。实验结果显示，HybridFlow在不同模型规模和算法下，训练吞吐量相比其他框架提升了1.5倍至20倍。目前，该论文已被EuroSys 2025接收，并公开了代码仓库。（摘要共计227字）

原文链接

本文链接：https://kx.umi6.com/article/8251.html

转载请注明文章出处

HybridFlow