2025年9月,蚂蚁集团在上海外滩大会发布基于扩散理论的新范式模型LLaDA-MoE,总参数量7B,激活参数1.4B,验证了工业级大规模训练的可行性。该模型由蓝振忠和李崇轩团队联合开发,克服了自回归模型的单向建模缺陷,具备并行解码、双向建模及错误修正能力。蚂蚁通过开源基础模型版和指令微调版,推动扩散语言模型(dLLM)领域的社区协作,并计划联合学界探索AGI新突破。这一成果为语言模型研究开辟新路径,标志着国内团队在dLLM规模化扩展上迈出重要一步。
原文链接
本文链接:https://kx.umi6.com/article/26048.html
转载请注明文章出处
相关推荐
换一换
微软与OpenAI矛盾的根源:AGI
2025-06-26 17:01:05
奥特曼:假如给我一千倍算力,我会这样做
2025-06-04 17:26:39
IBM CEO:以现有成本建设 AI 数据中心“几乎不可能回本”,当前技术实现 AGI 概率仅 1%
2025-12-02 20:34:23
AI进化成人的速度 可能比你想象的还慢
2025-11-12 06:50:02
蓝色巨人IBM看空AI:8万亿美元回不了本 AGI可能性0-1%
2025-12-03 20:41:46
GPT-5“让人失望”,AI“撞墙”了吗?
2025-08-17 19:40:29
李飞飞最新访谈:没有空间智能,AGI就不完整
2025-07-03 15:26:49
商汤林达华万字长文回答AGI:4层破壁,3大挑战
2025-08-12 18:21:05
贴脸开大,OpenAI 研究员当面嘲讽马斯克为 xAI 提出的 AGI 愿景
2025-10-22 08:41:17
华人团队终结Token危机:扩散模型数据潜力超自回归三倍
2025-08-13 17:38:29
Anthropic CEO 阿莫代伊:AI 模型出现“幻觉”的频率可能比人类还低
2025-05-24 00:33:44
荣耀CEO李健挥旗“开路”:开放共生 众木成林 让AI走进生活
2025-06-19 10:48:23
AGI 这个词“过时”了?硅谷大佬开始重金押注“超级智能”
2025-07-06 20:17:59
568 文章
325291 浏览
24小时热文
更多
-
2025-12-07 22:52:28 -
2025-12-07 22:51:22 -
2025-12-07 21:52:07