1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

正文:11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架专为解决RL训练中权重参数同步问题设计,可在秒级完成TB级大规模参数交换,显著降低训练延迟。其主要特点包括极速同步性能(千卡集群6秒内全量同步)、统一模型适配、零冗余传输、多模式传输支持及异构部署兼容等。Awex由WeightWriter、WeightReader和MetaServer三大组件构成,核心功能模块涵盖训推权重转换、元数据计算与交换、P2P传输计划及NCCL/RDMA传输。在千卡集群上,使用RDMA传输1TB模型权重仅需6秒。目前,Awex已支持Megatron和SGLang引擎,并计划未来开源ASystem的其他核心RL组件,进一步完善强化学习生态。

原文链接
本文链接:https://kx.umi6.com/article/28770.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
机器人运控训练步入分钟级时代!清华AIR开源UniLab:3分钟训好人形,速度暴涨10倍,Mac上也能跑
2026-06-02 12:26:59
蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
2025-10-24 11:36:00
于骞出席德国慕尼黑汽车论坛:世界模型+强化学习是通向物理AI的必经之路
2026-03-19 19:23:06
智元机器人、蚂蚁集团等成立未来科技公司
2025-11-11 11:11:12
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
波士顿动力 Spot 四足机器人学会连续后空翻,意外让行走姿态更像真实动物
2025-08-28 10:20:06
DeepSeek登《Nature》封面,梁文锋带队,首次回应争议
2025-09-18 13:54:10
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
无需外部数据!AI自问自答实现推理能力进化
2025-08-08 16:13:47
Cursor自研模型反超Opus 4.6!价格脚踝斩,氛围编程沸腾了
2026-03-20 12:25:37
24小时热文
更多
扫一扫体验小程序