
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
2025年7月,Inception Labs推出基于扩散技术的全新大语言模型Mercury,突破自回归模型逐词生成限制,采用“从噪声到结构化输出”方式,一次性预测所有方向的token,速度比传统工具快10倍。在NVIDIA H100 GPU上,Mercury实现最高1109 tokens/秒吞吐量,并通过并行化生成、动态去噪调度等优化硬件利用效率。其双向注意力机制和实时纠错模块显著提升代码生成的灵活性与准确性。团队由斯坦福、UCLA等顶尖高校教授创立,拥有谷歌、微软等资深专家支持。然而,超快生成速度也暴露当前CI测试瓶颈,引发行业对开发流程优化的讨论。Mercury在线体验平台已开放供用户试用。
原文链接
标题:速度秒杀GPT们10倍,国外的DeepSeek时代来了?
前几天,一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。
Mercury在多项测试中表现亮眼,其生成速度比...
原文链接
加载更多

暂无内容