9月11日,2025外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE。该模型在约20T数据上完成训练,性能超越此前稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,接近自回归模型Qwen2.5-3B-Instruct,并具备数倍推理速度优势。模型通过非自回归掩码扩散机制,挑战“语言模型必须自回归”的主流认知,在代码、数学等任务中表现优异。蚂蚁集团表示,模型及自研推理框架将于近期完全开源,推动全球AI社区技术发展。此外,蚂蚁将持续投入AGI领域,探索基于dLLM的未来突破路径。
原文链接
本文链接:https://kx.umi6.com/article/25108.html
转载请注明文章出处
相关推荐
换一换
腾讯混元OCR模型宣布开源
2025-11-25 15:00:37
字节跳动 Seed 团队发布扩散语言模型 Diffusion Preview,每秒推理速度 2146 tokens
2025-08-01 09:05:41
Qwen拿半成品刷下AIME’25满分,给别人留点面子吧……
2025-11-04 12:11:12
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
2025-11-16 11:28:16
小米开源首个原生端到端语音大模型
2025-09-19 10:10:03
蚂蚁开源业内首个 100B 扩散语言模型 LLaDA2.0
2025-12-12 15:57:42
阿里宣布Qwen3.5开源家族扩容
2026-02-25 12:17:28
DeepMind 没舍得开源的 Genie 3,被昆仑万维放出来了
2025-08-12 14:22:32
蚂蚁灵波开源具身大模型LingBot-VLA,让机器人“看的更清楚 做的更明白”
2026-01-28 11:08:15
美团视频生成模型正式发布并开源
2025-10-27 11:00:45
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
2025-11-14 13:57:27
蚂蚁与中国人民大学发布首个原生MoE扩散语言模型
2025-09-12 11:12:20
阿里千问开源Qwen3-Coder-Next模型
2026-02-04 08:31:48
679 文章
478801 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18