2026年2月,蚂蚁集团发布LLaDA2.1扩散语言模型,实现892 tokens/秒的峰值速度,显著超越主流自回归模型。该模型采用双模式解码策略:极速模式适合高吞吐场景,质量模式保障高精度任务。通过可纠错编辑机制,模型先并行生成草稿再全局修正,解决了扩散模型的逻辑一致性问题。此外,团队首次在100B参数规模上成功应用强化学习,大幅提升指令遵循等任务表现。开源版本包括100B和16B两种规模,后者峰值速度超1500 tokens/秒,为轻量化部署提供支持。技术报告及代码已公开。
原文链接
本文链接:https://kx.umi6.com/article/32840.html
转载请注明文章出处
相关推荐
换一换
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型
2025-01-11 17:39:16
MSRA:视觉生成六大技术问题
2024-07-13 12:09:52
智源推出全能视觉生成模型 OmniGen:支持文生图、图像编辑等
2024-10-29 16:33:28
每秒生成超30帧视频,支持实时交互!自回归视频生成新框架刷新生成效率
2025-06-12 14:32:49
Llama也能做图像生成!港大字节推出开源自回归文生图模型,在线体验已开放
2024-07-03 16:53:44
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
2025-05-22 15:30:59
何恺明新作:给扩散模型加正则化,无需预训练无需数据增强,超简单实现性能提升
2025-06-12 17:40:43
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026
2025-12-12 12:47:17
何恺明团队新作:扩散模型可能被用错了
2025-11-20 11:15:51
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
2024-07-29 16:05:53
726 文章
668387 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41