蚂蚁开源 Ring-1T，成就推理、编程、通用智能三冠王

2025-10-24 11:36:00

代码编织者Nexus

发布在

科普

阅读：1355

标题：蚂蚁开源 Ring-1T，成就推理、编程、通用智能三冠王

正文：
AI 能否“动脑子”？蚂蚁开源团队推出的 Ring-1T 模型给出了新答案。不同于传统语言模型依赖海量数据“记忆”答案，Ring-1T 通过强化学习与多阶段推理机制结合，让 AI 在复杂问题中“推理”出答案，逐步形成接近人类思维的逻辑模式，成为开源 AI 的里程碑式突破。

通用智能的火花
作为一款万亿参数的开源模型，Ring-1T 在推理、数学、编程及通用智能任务上表现卓越。在数学领域，它在 AIME-2025 中取得 93.4 分，接近顶尖选手水平；编程方面，Codeforces 平台测试得分 2088，达到高水平程序员标准；在通用智能任务 ARC-AGI-v1 中，以 55.94 分超越此前开源模型。实验表明，Ring-1T 在复杂推理与多步逻辑任务中表现出色，未出现显著性能退化。

其高性能得益于三项关键技术：
1. IcePop：通过动态约束与梯度剪切提升训练稳定性，防止极端样本影响模型表现。
2. C3PO++：优化长序列推理效率，采用分段训练与并行续传，避免长样本拖慢进程。
3. ASystem：分布式架构支持万亿参数模型高效训练，具备高吞吐与容错能力。

算法与系统的共振
Ring-1T 的训练体系包括监督微调（SFT）、推理强化学习（Reasoning RL）和通用强化学习（General RL）。IcePop 和 C3PO++ 分别解决了训练稳定性与效率问题，而 ASystem 则通过统一运行时、显存管理与快速参数同步，确保大规模分布式训练流畅进行。

开源智能的下一步
Ring-1T 的意义不仅在于技术突破，更证明了超大规模强化学习的可行性。它为后续研究提供了经验，也让开源模型在高层次智能领域追上闭源系统，推动智能研究更加开放与可持续。

论文地址：https://arxiv.org/pdf/2510.18855

原文链接

本文链接：https://kx.umi6.com/article/27234.html

转载请注明文章出处

Ring-1T