1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王

正文:
AI 能否“动脑子”?蚂蚁开源团队推出的 Ring-1T 模型给出了新答案。不同于传统语言模型依赖海量数据“记忆”答案,Ring-1T 通过强化学习与多阶段推理机制结合,让 AI 在复杂问题中“推理”出答案,逐步形成接近人类思维的逻辑模式,成为开源 AI 的里程碑式突破。

通用智能的火花
作为一款万亿参数的开源模型,Ring-1T 在推理、数学、编程及通用智能任务上表现卓越。在数学领域,它在 AIME-2025 中取得 93.4 分,接近顶尖选手水平;编程方面,Codeforces 平台测试得分 2088,达到高水平程序员标准;在通用智能任务 ARC-AGI-v1 中,以 55.94 分超越此前开源模型。实验表明,Ring-1T 在复杂推理与多步逻辑任务中表现出色,未出现显著性能退化。

其高性能得益于三项关键技术:
1. IcePop:通过动态约束与梯度剪切提升训练稳定性,防止极端样本影响模型表现。
2. C3PO++:优化长序列推理效率,采用分段训练与并行续传,避免长样本拖慢进程。
3. ASystem:分布式架构支持万亿参数模型高效训练,具备高吞吐与容错能力。

算法与系统的共振
Ring-1T 的训练体系包括监督微调(SFT)、推理强化学习(Reasoning RL)和通用强化学习(General RL)。IcePop 和 C3PO++ 分别解决了训练稳定性与效率问题,而 ASystem 则通过统一运行时、显存管理与快速参数同步,确保大规模分布式训练流畅进行。

开源智能的下一步
Ring-1T 的意义不仅在于技术突破,更证明了超大规模强化学习的可行性。它为后续研究提供了经验,也让开源模型在高层次智能领域追上闭源系统,推动智能研究更加开放与可持续。

论文地址:https://arxiv.org/pdf/2510.18855

原文链接
本文链接:https://kx.umi6.com/article/27234.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
全球闲置算力训个模型,性能媲美R1,老黄“天塌了”
2025-05-16 14:29:01
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现
2025-05-29 14:32:01
蚂蚁发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5
2025-10-14 11:14:06
小米最新大模型成果!罗福莉现身了
2025-10-17 16:21:28
截胡 OpenAI:谷歌率先公测“奥数金牌级”推理 AI 模型 Gemini 3 Deep Think
2025-12-05 14:33:37
强化学习之于 AI Agent,是灵魂、还是包袱?
2025-04-23 11:56:20
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
2025-05-08 11:29:43
谷歌 DeepMind 研究:Gemini AI 存“畏死”情绪,导致推理能力明显下降
2025-06-19 09:43:42
马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
2025-11-18 15:24:50
训练时间减半,性能不降反升!腾讯混元开源图像生成高效强化方案MixGRPO
2025-08-02 18:22:54
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
2025-11-08 13:43:06
蚂蚁开源 Ring-1T,成就推理、编程、通用智能三冠王
2025-10-24 11:36:00
24小时热文
更多
扫一扫体验小程序