9月11日,2025外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE。该模型在约20T数据上完成训练,性能超越此前稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,接近自回归模型Qwen2.5-3B-Instruct,并具备数倍推理速度优势。模型通过非自回归掩码扩散机制,挑战“语言模型必须自回归”的主流认知,在代码、数学等任务中表现优异。蚂蚁集团表示,模型及自研推理框架将于近期完全开源,推动全球AI社区技术发展。此外,蚂蚁将持续投入AGI领域,探索基于dLLM的未来突破路径。
原文链接
本文链接:https://kx.umi6.com/article/25108.html
转载请注明文章出处
相关推荐
.png)
换一换
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
2025-04-28 12:48:54
MiniMax 推出全球首个开源大规模混合架构的推理模型 M1:456B 参数,性能超 DeepSeek-R1
2025-06-17 17:28:14
外滩大会今年太AI了!王坚暴论:OpenAI确实站在了历史错误的一边
2025-09-12 12:10:41
微软将开源 GitHub Copilot Chat 扩展,推动 VS Code 成开源 AI 编辑器
2025-05-20 15:43:49
业界首个,腾讯混元 3D 世界模型正式发布并开源
2025-07-27 11:55:13
Hugging Face 桌面机器人 Reachy Mini 开订:长相呆萌,支持超 170 万个 AI 模型
2025-07-09 16:06:14
昆仑万维发布并开源Matrix-Game 2.0模型
2025-08-12 10:17:03
年后完成第四轮融资,智谱再获北京人工智能产业投资基金 2 亿追投
2025-04-18 16:21:15
消息称 Meta 正讨论放弃开源 AI 模型 Behemoth,转向闭源战略
2025-07-15 15:46:36
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
2025-07-11 23:44:58
GitHub一周2000星!国产统一图像生成模型神器升级,理解质量双up,还学会了“反思”
2025-07-03 13:21:28
DeepSeek开源新模型,数学推理能力大提升
2025-05-01 09:16:24
不玩噱头的北京,用数据和实力成就「全球开源之都」
2025-05-20 20:44:53
476 文章
164903 浏览
24小时热文
更多

-
2025-09-12 13:12:36
-
2025-09-12 13:12:25
-
2025-09-12 12:15:23