2025年9月12日,在2025Inclusion·外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型“LLaDA-MoE”。该模型在约20T数据上完成从零训练,验证了工业级大规模训练的扩展性与稳定性。模型将在近期完全开源,旨在推动全球AI社区在扩散语言模型(dLLM)领域的技术发展。这一成果标志着AI模型架构及训练方法的重要突破。(记者 黄心怡)
原文链接
本文链接:https://kx.umi6.com/article/25117.html
转载请注明文章出处
相关推荐
换一换
蚂蚁集团通用 AI 助手灵光上线网页版,可“30 秒用自然语言生成小应用”
2025-12-09 11:28:27
蚂蚁集团回应新模型训练成本降低:基于不同芯片持续调优,会逐步开源
2025-03-24 17:06:03
蚂蚁发布AI健康应用AQ 打通华为、vivo、鱼跃等智能硬件
2025-06-26 15:00:09
字节跳动 Seed 团队发布扩散语言模型 Diffusion Preview,每秒推理速度 2146 tokens
2025-08-01 09:05:41
蚂蚁集团开源全球首个万亿参数推理大模型 Ring-1T-preview,代码生成能力超 GPT-5
2025-09-30 11:26:40
蚂蚁集团向假医疗广告“宣战”,旗下 AI 健康管家 AQ 上线多项打假措施
2025-08-18 14:46:24
蚂蚁集团旗下公司等入股烨知芯科技 后者经营范围含集成电路芯片设计等
2025-09-03 14:50:33
蚂蚁集团副总裁、前基础大模型负责人徐鹏离职
2025-04-12 11:41:50
蚂蚁自研2900亿大模型用国产AI芯片训练,计算成本508万元低于DeepSeek
2025-03-24 12:55:38
推理性能提升10倍!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
2025-10-13 18:00:58
杭州蚂蚁投了家腾讯系具身智能公司
2025-11-23 23:26:16
中国AI应用跑出全球速度,灵光4天突破100万下载
2025-11-22 15:23:19
智元机器人、蚂蚁集团等成立未来科技公司
2025-11-11 11:11:12
681 文章
452092 浏览
24小时热文
更多
-
2026-01-23 06:34:26 -
2026-01-23 00:20:44 -
2026-01-22 23:18:34