1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王

正文:
AI 能否“动脑子”?蚂蚁开源团队推出的 Ring-1T 模型给出了新答案。不同于传统语言模型依赖海量数据“记忆”答案,Ring-1T 通过强化学习与多阶段推理机制结合,让 AI 在复杂问题中“推理”出答案,逐步形成接近人类思维的逻辑模式,成为开源 AI 的里程碑式突破。

通用智能的火花
作为一款万亿参数的开源模型,Ring-1T 在推理、数学、编程及通用智能任务上表现卓越。在数学领域,它在 AIME-2025 中取得 93.4 分,接近顶尖选手水平;编程方面,Codeforces 平台测试得分 2088,达到高水平程序员标准;在通用智能任务 ARC-AGI-v1 中,以 55.94 分超越此前开源模型。实验表明,Ring-1T 在复杂推理与多步逻辑任务中表现出色,未出现显著性能退化。

其高性能得益于三项关键技术:
1. IcePop:通过动态约束与梯度剪切提升训练稳定性,防止极端样本影响模型表现。
2. C3PO++:优化长序列推理效率,采用分段训练与并行续传,避免长样本拖慢进程。
3. ASystem:分布式架构支持万亿参数模型高效训练,具备高吞吐与容错能力。

算法与系统的共振
Ring-1T 的训练体系包括监督微调(SFT)、推理强化学习(Reasoning RL)和通用强化学习(General RL)。IcePop 和 C3PO++ 分别解决了训练稳定性与效率问题,而 ASystem 则通过统一运行时、显存管理与快速参数同步,确保大规模分布式训练流畅进行。

开源智能的下一步
Ring-1T 的意义不仅在于技术突破,更证明了超大规模强化学习的可行性。它为后续研究提供了经验,也让开源模型在高层次智能领域追上闭源系统,推动智能研究更加开放与可持续。

论文地址:https://arxiv.org/pdf/2510.18855

原文链接
本文链接:https://kx.umi6.com/article/27234.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
发自 凹非寺量子位 | 公众号 QbitAI 奥特曼点名表扬了两个波兰人。 没有他们,OpenAI就不是今天的样子。 他们是OpenAI首席科学家Jakub Pachocki以及头衔为“Technical Fellow”的Szymon Sidor。 △左:Jakub Pachocki,右:Szymon Sidor 两人不仅是波兰老乡,而且是高中同学,读博时分别选择了计算机科学和机器人,后来又在OpenAI重聚。 在ChatGPT风靡全球、每天服务数亿用户的今天,奥特曼感慨大多数人永远不会想到背
2025-09-09 18:18:27
Cursor发布首个编程大模型!代码生成250tokens/秒,强化学习+MoE架构
2025-10-30 10:33:49
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
DeepSeekV3.2技术报告还是老外看得细
2025-12-04 09:09:55
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
机器狗能打羽毛球:仅靠强化学习从 0 自学,还会自己移步
2025-05-30 17:53:28
突破Agent长程推理效率瓶颈!MIT&NUS联合推出强化学习新训练方法
2025-08-22 16:50:16
于骞出席德国慕尼黑汽车论坛:世界模型+强化学习是通向物理AI的必经之路
2026-03-19 19:23:06
小米最新大模型成果!罗福莉现身了
2025-10-17 16:21:28
苹果最新研究:现有 AI 大模型“更像是在记忆,而非真正的推理”
2025-06-08 17:10:55
真正的AI竞争力,藏在大模型“后训练”这一步
2025-10-13 16:59:55
2025年度最全面的AI报告:谁在赚钱,谁爱花钱,谁是草台班子
2025-10-13 17:00:38
24小时热文
更多
扫一扫体验小程序