3月4日,蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。该版本主打“Agent一键接入RL训练”,无需修改代码,兼容各类Agent框架,实现智能体强化学习训练开箱即用。AReaL是首个全异步训推解耦的大模型强化学习系统,可让Agent在真实任务中获得反馈并持续优化决策。v1.0通过新增Proxy Worker中转层,开发者只需修改请求地址即可完成零改造接入RL训练,大幅降低使用门槛。这一发布为强化学习领域提供了更高效、灵活的工具。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/33404.html
转载请注明文章出处
相关推荐
换一换
蚂蚁集团推出两款 MoE 大模型,用国产芯片训练成本显著降低
2025-03-24 16:08:27
蚂蚁已部署万卡规模国产算力群
2025-11-08 17:53:47
蚂蚁集团通用 AI 助手灵光上线网页版,可“30 秒用自然语言生成小应用”
2025-12-09 11:28:27
AI赛车成功闯过天门山99道弯 世界AI竞速锦标赛清华夺冠
2025-10-20 19:14:40
蚂蚁集团 AI 金融管家“蚂小财”全新亮相,月活用户数达 7000 万
2024-09-06 14:15:23
清华大学获X-Embodiment最佳论文奖,机器人顶会CoRL 2024获奖名单出炉
2024-11-14 15:18:01
蚂蚁集团向假医疗广告“宣战”,旗下 AI 健康管家 AQ 上线多项打假措施
2025-08-18 14:46:24
从“百模大战”到行业整合,大模型创企开始被大厂“收编”
2024-11-25 11:06:22
蚂蚁集团披露AI普惠进展:三大AI管家已服务超1.3亿用户 43%来自三线及以下城市
2025-06-30 11:44:08
清华大学 2026 年首篇 Science 论文:AI 帮助药物虚拟筛选提速百万倍,数据库面向全球免费开放
2026-01-09 13:16:10
中国科学家研发出“能屈能伸”的柔性AI芯片
2026-01-29 11:24:55
清华第五部秘籍出炉!玩转 DeepSeek 先过这关(附全集资源下载)
2025-02-23 19:03:09
未来智能完成亿元级A轮融资 蚂蚁集团领投、启明创投超额跟投
2025-10-13 16:02:23
664 文章
461593 浏览
24小时热文
更多
-
2026-03-04 12:39:48 -
2026-03-04 11:36:51 -
2026-03-04 11:32:43