9月11日,2025外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE。该模型在约20T数据上完成训练,性能超越此前稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,接近自回归模型Qwen2.5-3B-Instruct,并具备数倍推理速度优势。模型通过非自回归掩码扩散机制,挑战“语言模型必须自回归”的主流认知,在代码、数学等任务中表现优异。蚂蚁集团表示,模型及自研推理框架将于近期完全开源,推动全球AI社区技术发展。此外,蚂蚁将持续投入AGI领域,探索基于dLLM的未来突破路径。
原文链接
本文链接:https://kx.umi6.com/article/25108.html
转载请注明文章出处
相关推荐
换一换
对话Kimi付强:别把模型当宠物圈养,追逐AGI就要让模型与人类共同演化
2025-10-04 10:57:38
腾讯混元世界模型 1.1 版本发布并开源:单卡即可部署,秒级创造 3D 世界
2025-10-22 18:50:23
通义万相全新动作生成模型开源
2025-09-19 15:17:03
腾讯智能体框架 Youtu-Agent 开源,搭建 Agent 只需两步
2025-09-02 16:34:48
DeepSeek昨天开源的新模型,有点邪门
2025-10-22 10:42:03
英伟达一口气开源多项机器人技术,与迪士尼合作的物理引擎也开源
2025-10-02 12:10:18
北京人形开源最新VLM模型,推动具身智能再迈关键一步 !
2025-11-14 13:57:27
智谱视觉推理模型 GLM-4.5V 上线并开源,号称“全球 100B 级效果最佳”
2025-08-11 23:10:30
小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,对话自然度、交互适配达拟人化水准
2025-09-19 11:13:29
小米全面开源具身大模型MiMo-Embodied
2025-11-21 21:43:50
鏖战2025年,大模型围着开源转
2025-12-25 18:55:44
老外担心中国大模型也学OpenAI闭源 智谱回应:别慌 会继续开源
2026-03-21 12:05:31
月之暗面杨植麟、周昕宇、吴育昕罕见回应一切:打假 460 万美元、调侃 OpenAI
2025-11-12 09:56:27
711 文章
552394 浏览
24小时热文
更多
-
2026-04-24 18:30:24 -
2026-04-24 18:29:17 -
2026-04-24 18:28:12