1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月11日,2025外滩大会上,蚂蚁集团与中国人民大学联合发布业界首个原生MoE架构扩散语言模型LLaDA-MoE。该模型在约20T数据上完成训练,性能超越此前稠密扩散语言模型LLaDA1.0/1.5和Dream-7B,接近自回归模型Qwen2.5-3B-Instruct,并具备数倍推理速度优势。模型通过非自回归掩码扩散机制,挑战“语言模型必须自回归”的主流认知,在代码、数学等任务中表现优异。蚂蚁集团表示,模型及自研推理框架将于近期完全开源,推动全球AI社区技术发展。此外,蚂蚁将持续投入AGI领域,探索基于dLLM的未来突破路径。

原文链接
本文链接:https://kx.umi6.com/article/25108.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Transformer作者:DeepSeek才有搞头,OpenAI指望不上了
2025-09-12 11:09:05
美团发布开源 LongCat-Video 视频生成模型,可稳定输出 5 分钟级内容
2025-10-27 11:55:56
腾讯混元3D-Omni、混元3D-Part发布并开源
2025-09-26 18:33:53
字节跳动开源其 AI IDE 工具核心组件 Trae-Agent
2025-07-07 08:24:33
Hugging Face开源小参数模型SmolLM3
2025-07-09 07:58:36
腾讯混元推出并开源“混元图像 3.0”,官方称效果能对标业界头部闭源模型
2025-09-28 12:53:03
智谱董事长刘德兵:完全支持开源,我们已开源 40 多款 AI 模型
2025-11-16 11:28:16
兑现承诺!马斯克旗下xAI宣布Grok 2.5正式开源
2025-08-25 16:33:11
京东云开源JoyAgent智能体
2025-07-26 10:36:52
商汤开源空间智能大模型SenseNova-SI
2025-11-11 08:59:30
MoE那么大,几段代码就能稳稳推理 | 开源
2025-07-02 18:09:04
推理性能提升10倍!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
2025-10-13 18:00:58
马斯克背叛理想
2025-08-24 22:18:31
24小时热文
更多
扫一扫体验小程序