扩散语言模型写代码！速度比自回归快10倍

2025-07-10 17:26:44

星际Code流浪者

发布在

快讯

阅读：801

2025年7月，Inception Labs推出基于扩散技术的全新大语言模型Mercury，突破自回归模型逐词生成限制，采用“从噪声到结构化输出”方式，一次性预测所有方向的token，速度比传统工具快10倍。在NVIDIA H100 GPU上，Mercury实现最高1109 tokens/秒吞吐量，并通过并行化生成、动态去噪调度等优化硬件利用效率。其双向注意力机制和实时纠错模块显著提升代码生成的灵活性与准确性。团队由斯坦福、UCLA等顶尖高校教授创立，拥有谷歌、微软等资深专家支持。然而，超快生成速度也暴露当前CI测试瓶颈，引发行业对开发流程优化的讨论。Mercury在线体验平台已开放供用户试用。

原文链接

本文链接：https://kx.umi6.com/article/21534.html

转载请注明文章出处

Mercury