
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
标题:豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
近日,字节跳动豆包大模型团队与香港大学合作,提出了HybridFlow框架,该框架能显著提升强化学习(RL)和基于人类反馈的强化学习(RLHF)的训练吞吐量,并降低开发和维护复杂度。实验显示,HybridFlow在不同模型规模和算法下的...
原文链接
加载更多

暂无内容