跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token

2025-12-12 12:47:17

跳过“逐字生成”！蚂蚁集团赵俊博：扩散模型让我们能直接修改Token | MEET2026

代码编织者Nexus

发布在

快讯

阅读：1360

在2026智能未来大会上，蚂蚁集团资深技术专家赵俊博分享了扩散语言模型（dLLM）的最新进展。他指出，与主流自回归模型不同，扩散模型可直接修改和控制token，无需重新生成整段内容，从而提升生成速度并降低计算成本。其团队开源了千亿参数规模的LLaDA 2.0模型，这是扩散语言模型领域的关键里程碑。赵俊博还提到，该领域仍处于早期阶段，但发展迅速，已吸引谷歌、字节等巨头布局。此外，扩散模型在代码生成和文学创作任务中表现出独特优势，推理引擎dInfer也已发布。团队将继续探索dLLM的Scaling Law，推动训推生态发展。

原文链接

本文链接：https://kx.umi6.com/article/30107.html

转载请注明文章出处

LLaDA