蚂蚁与中国人民大学发布首个原生MoE扩散语言模型

2025-09-12 11:12:20

E-Poet

发布在

快讯

阅读：951

2025年9月12日，在2025Inclusion·外滩大会上，蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构的扩散语言模型“LLaDA-MoE”。该模型在约20T数据上完成从零训练，验证了工业级大规模训练的扩展性与稳定性。模型将在近期完全开源，旨在推动全球AI社区在扩散语言模型（dLLM）领域的技术发展。这一成果标志着AI模型架构及训练方法的重要突破。（记者黄心怡）

原文链接

本文链接：https://kx.umi6.com/article/25117.html

转载请注明文章出处

中国人民大学