2025年7月,Inception Labs推出基于扩散技术的全新大语言模型Mercury,突破自回归模型逐词生成限制,采用“从噪声到结构化输出”方式,一次性预测所有方向的token,速度比传统工具快10倍。在NVIDIA H100 GPU上,Mercury实现最高1109 tokens/秒吞吐量,并通过并行化生成、动态去噪调度等优化硬件利用效率。其双向注意力机制和实时纠错模块显著提升代码生成的灵活性与准确性。团队由斯坦福、UCLA等顶尖高校教授创立,拥有谷歌、微软等资深专家支持。然而,超快生成速度也暴露当前CI测试瓶颈,引发行业对开发流程优化的讨论。Mercury在线体验平台已开放供用户试用。
原文链接
本文链接:https://kx.umi6.com/article/21534.html
转载请注明文章出处
相关推荐
.png)
换一换
1230 亿参数,Mistral 发布 Large 2 旗舰 AI 模型:支持 80 多种编程语言,增强代码生成、数学和推理能力
2024-07-25 08:13:10
GitHub Copilot 推出视觉功能:图片可秒变代码
2025-02-08 10:20:04
未来的科技历史,将如何发展?
2025-03-07 10:03:26
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
2024-07-29 16:05:53
速度秒杀GPT们10倍,国外的DeepSeek时刻来了?
2025-03-14 08:00:03
英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍
2025-06-03 12:54:51
又一开源AI神器!将机器学习论文自动转为可运行代码库
2025-05-01 12:21:11
寡姐带货国风 Polo 衫、马斯克穿牛仔走红毯:虚拟试衣新框架,只需两张图 30 秒即生成
2024-07-30 22:12:57
苹果发布 DiffuCode-7B-cpGRPO 编程 AI 模型:基于 Qwen2.5-7B,可不按顺序生成代码
2025-07-05 09:57:16
微软 Visual Studio 上线 GPT-5,复杂任务推理决策能力“大幅”提升
2025-08-13 08:31:33
从不确定到安全:如何安全控制复杂物理系统
2025-07-19 17:56:25
谷歌 Fluid 颠覆共识:两大因素被发现,AI 文生图领域自回归模型超越扩散模型
2024-10-23 14:39:38
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
2025-01-11 12:37:26
549 文章
250670 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20