标题:蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
正文:
AI 能否“动脑子”?蚂蚁开源团队推出的 Ring-1T 模型给出了新答案。不同于传统语言模型依赖海量数据“记忆”答案,Ring-1T 通过强化学习与多阶段推理机制结合,让 AI 在复杂问题中“推理”出答案,逐步形成接近人类思维的逻辑模式,成为开源 AI 的里程碑式突破。
通用智能的火花
作为一款万亿参数的开源模型,Ring-1T 在推理、数学、编程及通用智能任务上表现卓越。在数学领域,它在 AIME-2025 中取得 93.4 分,接近顶尖选手水平;编程方面,Codeforces 平台测试得分 2088,达到高水平程序员标准;在通用智能任务 ARC-AGI-v1 中,以 55.94 分超越此前开源模型。实验表明,Ring-1T 在复杂推理与多步逻辑任务中表现出色,未出现显著性能退化。
其高性能得益于三项关键技术:
1. IcePop:通过动态约束与梯度剪切提升训练稳定性,防止极端样本影响模型表现。
2. C3PO++:优化长序列推理效率,采用分段训练与并行续传,避免长样本拖慢进程。
3. ASystem:分布式架构支持万亿参数模型高效训练,具备高吞吐与容错能力。
算法与系统的共振
Ring-1T 的训练体系包括监督微调(SFT)、推理强化学习(Reasoning RL)和通用强化学习(General RL)。IcePop 和 C3PO++ 分别解决了训练稳定性与效率问题,而 ASystem 则通过统一运行时、显存管理与快速参数同步,确保大规模分布式训练流畅进行。
开源智能的下一步
Ring-1T 的意义不仅在于技术突破,更证明了超大规模强化学习的可行性。它为后续研究提供了经验,也让开源模型在高层次智能领域追上闭源系统,推动智能研究更加开放与可持续。
论文地址:https://arxiv.org/pdf/2510.18855
-
2025-10-24 21:54:02 -
2025-10-24 21:53:50 -
2025-10-24 19:49:44