2025年7月,Inception Labs推出基于扩散技术的全新大语言模型Mercury,突破自回归模型逐词生成限制,采用“从噪声到结构化输出”方式,一次性预测所有方向的token,速度比传统工具快10倍。在NVIDIA H100 GPU上,Mercury实现最高1109 tokens/秒吞吐量,并通过并行化生成、动态去噪调度等优化硬件利用效率。其双向注意力机制和实时纠错模块显著提升代码生成的灵活性与准确性。团队由斯坦福、UCLA等顶尖高校教授创立,拥有谷歌、微软等资深专家支持。然而,超快生成速度也暴露当前CI测试瓶颈,引发行业对开发流程优化的讨论。Mercury在线体验平台已开放供用户试用。
原文链接
本文链接:https://kx.umi6.com/article/21534.html
转载请注明文章出处
相关推荐
.png)
换一换
又一开源AI神器!将机器学习论文自动转为可运行代码库
2025-05-01 12:21:11
DeepMind大模型再登Nature:8分钟预测15日天气,准确度超顶尖物理模型
2024-12-05 16:02:34
未来的科技历史,将如何发展?
2025-03-07 10:03:26
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
GAN已死?GAN万岁!布朗康奈尔新作爆火,一夜碾压扩散模型
2025-01-11 17:39:16
大模型自指:代码生成的递归式自我提升
2025-09-02 20:37:56
为什么只有AI编程成功落地?
2025-01-14 11:12:57
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
“Vibe Coding”兴起,代码界的“瘟疫”?
2025-03-10 09:27:53
ChatGPT 的编码能力到底有多强?
2024-07-23 14:14:29
MSRA:视觉生成六大技术问题
2024-07-13 12:09:52
GitHub Copilot 推出视觉功能:图片可秒变代码
2025-02-08 10:20:04
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
499 文章
160156 浏览
24小时热文
更多

-
2025-09-05 11:18:12
-
2025-09-05 11:17:03
-
2025-09-05 10:23:48