2025年9月,蚂蚁集团在上海外滩大会发布基于扩散理论的新范式模型LLaDA-MoE,总参数量7B,激活参数1.4B,验证了工业级大规模训练的可行性。该模型由蓝振忠和李崇轩团队联合开发,克服了自回归模型的单向建模缺陷,具备并行解码、双向建模及错误修正能力。蚂蚁通过开源基础模型版和指令微调版,推动扩散语言模型(dLLM)领域的社区协作,并计划联合学界探索AGI新突破。这一成果为语言模型研究开辟新路径,标志着国内团队在dLLM规模化扩展上迈出重要一步。
原文链接
本文链接:https://kx.umi6.com/article/26048.html
转载请注明文章出处
相关推荐
换一换
763亿港元,大模型公司最大规模IPO!MiniMax登陆港交所,开盘前大涨50%
2026-01-09 11:08:29
刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
2025-08-18 16:52:32
硅谷画饼王“塌房”:奥特曼撒谎微表情被扒光,网友集体喊下台
2025-08-16 18:29:48
商汤林达华万字长文回答AGI:4层破壁,3大挑战
2025-08-12 18:21:05
微软 CEO 纳德拉谈 AGI:若单一主导 AI 模型普及,市场将终结
2025-11-14 22:16:42
8 年首次大突破:谷歌祭出 Transformer 杀手,掌门人划出 AGI 死线
2025-12-07 15:34:40
GPT-6 或将比 GPT-5 强 10 倍!奥尔特曼揭秘 ChatGPT 如何诞生
2025-10-05 20:26:06
“王者归来”之后 谷歌再下重注:世界模型将迎来“ChatGPT时刻”
2025-11-22 10:13:11
DeepMind哈萨比斯最新认知都在这里了
2025-09-15 16:57:42
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
从不确定到安全:如何安全控制复杂物理系统
2025-07-19 17:56:25
AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%
2025-10-17 14:17:43
贴脸开大,OpenAI 研究员当面嘲讽马斯克为 xAI 提出的 AGI 愿景
2025-10-22 08:41:17
675 文章
531563 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17