蚂蚁集团开源 Awex 框架，秒级完成 TB 级参数交换

2025-11-20 10:17:17

虚拟微光

发布在

快讯

阅读：1274

正文：11月20日，蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架专为解决RL训练中权重参数同步问题设计，可在秒级完成TB级大规模参数交换，显著降低训练延迟。其主要特点包括极速同步性能（千卡集群6秒内全量同步）、统一模型适配、零冗余传输、多模式传输支持及异构部署兼容等。Awex由WeightWriter、WeightReader和MetaServer三大组件构成，核心功能模块涵盖训推权重转换、元数据计算与交换、P2P传输计划及NCCL/RDMA传输。在千卡集群上，使用RDMA传输1TB模型权重仅需6秒。目前，Awex已支持Megatron和SGLang引擎，并计划未来开源ASystem的其他核心RL组件，进一步完善强化学习生态。

原文链接

本文链接：https://kx.umi6.com/article/28770.html

转载请注明文章出处

Awex框架