2026年2月,硅谷初创公司Inception Labs发布扩散模型Mercury 2,成为全球生成速度最快的深度学习模型。其在英伟达GPU上实现每秒1009个tokens的生成速度,比GPT-5 Mini和Claude-4.5 Haiku快5倍。Mercury 2采用并行优化机制,摒弃传统自回归逐字生成方式,通过整体编辑提升效率,延迟低至1.7秒,且性能优异,在GPQA、LCB、AIME等基准测试中表现突出。此外,其价格具有竞争力,输入和输出分别为每百万token 0.25美元和0.75美元。背后团队自2019年起研究扩散模型,核心成员包括斯坦福教授Stefano Ermon等。Mercury 2获英伟达、微软等机构投资支持,目前暂无开源计划,但API兼容OpenAI标准,可在线体验。
原文链接
本文链接:https://kx.umi6.com/article/33201.html
转载请注明文章出处
相关推荐
换一换
材料设计重大突破!微软发布创新大模型,准确率提升10倍!
2025-01-17 16:19:05
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
2025-02-18 13:14:03
港大赵恒爽团队论文:让扩散模型既拿高分又不「作弊」丨CVPR 2026
2026-03-20 16:52:29
何恺明团队新作:扩散模型可能被用错了
2025-11-20 11:15:51
图灵奖得主加持,蒙特卡洛树搜索×扩散模型杀回规划赛道|ICML 2025 Spotlight
2025-08-01 14:00:21
小众架构赢麻了!通过编辑功能让100B扩散模型飙出892 tokens/秒的速度!
2026-02-11 10:10:31
ViT一作盛赞:这个中国开源“PS模型”强过Nano Banana
2025-12-29 13:21:05
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026
2025-12-12 12:47:17
挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改
2026-05-13 23:00:53
12秒生成1万token!谷歌推出文本「扩散模型」Gemini Diffusion,研究员:演示都得降速看
2025-05-22 15:30:59
OpenAI宋飏被Meta挖跑了!扩散模型崛起关键人物,加入MSL再会师清华校友赵晟佳
2025-09-25 22:11:00
突破瓶颈!北航ETH等首次将扩散模型完全量化至1bit,28倍存储节省+52.7倍效率提升
2025-01-11 12:37:26
DiT突遭怒喷,谢赛宁淡定回应
2025-08-20 17:19:58
690 文章
613341 浏览
24小时热文
更多
-
2026-06-09 00:54:40 -
2026-06-09 00:53:08 -
2026-06-08 23:49:41