1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年9月,蚂蚁集团在上海外滩大会发布基于扩散理论的新范式模型LLaDA-MoE,总参数量7B,激活参数1.4B,验证了工业级大规模训练的可行性。该模型由蓝振忠和李崇轩团队联合开发,克服了自回归模型的单向建模缺陷,具备并行解码、双向建模及错误修正能力。蚂蚁通过开源基础模型版和指令微调版,推动扩散语言模型(dLLM)领域的社区协作,并计划联合学界探索AGI新突破。这一成果为语言模型研究开辟新路径,标志着国内团队在dLLM规模化扩展上迈出重要一步。

原文链接
本文链接:https://kx.umi6.com/article/26048.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
为何强化学习火遍硅谷?AGI的关键一步
2025-08-07 15:55:40
最快IPO AI公司将至!MiniMax冲击港股 阿里米哈游腾讯加持
2025-12-22 00:12:32
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
2025-12-11 19:06:41
AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%
2025-10-17 14:17:43
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
商汤「日日新6.5」全新升级,让AI完成从“工具”到“人”的跃迁
2025-07-29 20:35:07
AI进化成人的速度 可能比你想象的还慢
2025-11-12 06:50:02
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
谷歌招聘“高级 AI 经济学家”,旨在了解 AGI 将如何影响我们的钱包
2025-11-06 18:08:13
没有商业模式,是DeepSeek最坚固的「护城河」
2026-01-21 14:10:41
AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办
2025-07-25 16:25:39
“全球大模型第一股”花落智谱,CEO 张鹏回应没实现 AGI 就上市
2026-01-12 12:31:11
Grok4全网玩疯,成功通过小球编程测试,Epic创始人:这就是AGI
2025-07-11 17:42:54
24小时热文
更多
扫一扫体验小程序