综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
11月20日,蚂蚁集团宣布开源万亿参数强化学习高性能权重交换框架Awex。该框架基于其自研技术,能够在数千卡GPU集群上实现5-10秒内完成万亿参数级别的权重同步。今年10月,蚂蚁集团已开源两款旗舰模型:非思考模型Ling-1T和思考模型Ring-1T,其中Ring-1T正是依托Awex框架开发。这一开源项目为大规模人工智能模型训练提供了重要技术支持,进一步推动了高性能计算与强化学习领域的发展。
原文链接
10月14日,蚂蚁集团发布并开源了万亿参数思考模型Ring-1T,同时公开模型权重与训练配方。该模型在9月30日开源的预览版Ring-1T-preview基础上,进一步扩展了大规模可验证奖励强化学习(RLVR)训练,显著提升自然语言推理能力,并通过RLHF训练优化通用能力,在多项任务榜单中表现更加均衡。这一进展展示了蚂蚁在大模型领域的技术实力,也为行业提供了重要开源资源。
原文链接
10月14日,蚂蚁集团发布并开源万亿参数思考模型Ring-1T,综合能力逼近GPT-5。该模型在预览版基础上扩展强化学习训练,提升自然语言推理和通用能力,在多项任务中表现均衡。实验显示,Ring-1T成功解出IMO2025赛题中的四道题目,达银牌水平,并在医疗问答HealthBench测评中取得开源领域最佳成绩。为解决训推精度差异难题,蚂蚁采用自研‘棒冰’算法及高性能强化学习系统ASystem,确保训练稳定性。Ring-1T基于Ling 2.0架构,通过多阶段训练显著提升复杂推理与通用能力。用户可通过HuggingFace等平台下载模型或在线体验。目前,蚂蚁百灵大模型已发布18款模型,形成160亿至1万亿参数的产品矩阵,正式迈入2.0阶段。
原文链接
10月9日,蚂蚁百灵大模型团队发布万亿参数语言模型Ling-1T,这是继9月末开源Ring-1T-preview后的又一重磅动作。两款模型分别定位为非思考模型和思考模型,均达到万亿参数规模,接近人类大脑神经元数量。Ling-1T在编程、数学推理等领域表现优异,甚至超越DeepSeek等知名模型。蚂蚁选择完全开源,旨在推动AGI生态共建,降低开发者技术门槛。此外,蚂蚁已形成从160亿到1万亿参数的完整模型矩阵,并通过强化学习框架AReaL等技术赋能行业。蚂蚁集团明确“AI First”战略,持续探索智能上限,致力于铺设AI基础设施,吸引更多参与者共同迈向通用人工智能(AGI)。
原文链接
2025年10月,蚂蚁集团正式开源其最新万亿参数语言模型Ling-1T,成为国内开源大模型领域新标杆。该模型在代码生成、逻辑推理、竞赛数学等多项复杂任务中表现优异,超越DeepSeek-V3.1-Terminus、GPT-5-main等知名模型,并取得SOTA成绩。Ling-1T采用“演进式思维链”训练方法,强化推理能力,支持128K上下文窗口,响应速度快且生成内容精准。研究团队创新性提出“语法–功能–美学”混合奖励机制及LPO优化方法,进一步提升模型性能。此次开源延续了中国大模型厂商的活跃节奏,此前Qwen与DeepSeek均发布重要更新,展现了国产模型在全球技术竞争中的领先地位。未来,中国大模型领域的持续创新值得期待。
原文链接
Kimi开源新突破:20秒更新万亿参数的中间件问世
Kimi开源再次带来惊喜!最新发布的中间件“checkpoint-engine(检查点引擎)”,让Kimi K2模型在数千个GPU上仅需约20秒即可完成1万亿参数的更新,进入“秒更时代”。
该中间件专为强化学习设计,优化了大语言模型推理中的权重更新...
原文链接
华为云在第五届深圳国际人工智能展(GAIE)上展示了其昇腾AI云服务的显著提升,将万亿参数模型的训练无中断时长从2.8天优化至40天,同时将集群故障恢复时间从60分钟缩短至10分钟。这一突破使得昇腾AI云服务在训练效率上超越业界平均水平。目前,该服务已适配超过100个行业的主流大模型,提供从开发到应用的全方位云服务支持。
华为云的盘古大模型5.0也在多个领域取得了重大进展,包括覆盖从十亿级到万亿级的多种规模模型以适应不同行业需求;多模态能力使模型能够理解并生成符合物理世界规律的文本、图片、视频等内容;通过结合思维链与策略搜索技术,盘古大模型展现了强大的数学能力和复杂任务规划能力。这些升级让盘古大模型在30多个行业、400多个场景中成功落地。
原文链接
【2023年8月31日】国内运营商最大单集群智算中心——中国移动智算中心(哈尔滨)于8月30日正式投入使用。此智算中心单集群算力规模全国第一,采用国产化网络设备,实现100%AI芯片国产化,并首次探索了1.8万张智算卡单集群部署的规模上限。拥有6.9EFLOPS智能算力及150P的融合分级存储,搭载GSE1.0、天池SDN等自主研发技术,显著提升GPU节点间通信效率,缩短数据训练时间达20%。这一设施的投用,标志着中国在人工智能基础设施建设方面取得了重要进展,能有效支撑万亿参数级别的大模型训练需求,对推动人工智能技术发展具有重要意义。
原文链接
【财联社8月8日讯】中国移动宣布在AI+行动计划下,正全力推进“三个万”战略目标,旨在显著提升AI技术应用的规模效应。具体来说,中国移动已成功投产运行“万卡智算集群”,并投入了大量资源进行数据训练,目前已有5万亿级token数据投入训练,计划进一步增加至十几万亿。此外,万亿参数大模型项目也正在紧锣密鼓地推进中。展望未来,中国移动将围绕“两个新型”升级计划、“AI+”行动计划和“BASIC6”科创计划三大战略方向展开工作,持续推动人工智能领域的技术创新与应用落地。这一系列举措彰显了中国移动在AI领域坚定的创新决心与长远布局,预示着其在数字化转型道路上的又一里程碑。
原文链接
在2024世界人工智能大会上,阶跃星辰发布Step系列通用大模型新品,包括万亿参数语言模型(Step-2)、多模态模型(Step-1.5V)和图像生成模型(Step-1X)。Step-2采用MoE架构,Step-1.5V升级后具备出色视频理解能力。阶跃星辰展示了面向C端的智能助手“跃问”和AI开放世界平台“冒泡鸭”,并与上海电影合作,如《大闹天宫》AI互动体验,利用大模型技术激活经典IP。此外,阶跃星辰与财跃星辰、国泰君安证券签署战略合作,聚焦金融领域智能应用,提升证券行业智能能力。这些创新举措表明大模型市场正加速商业化竞争,阶跃星辰致力于C端和B端高价值领域的探索。
原文链接
加载更多
暂无内容