1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:速度秒杀GPT们10倍,国外的DeepSeek时代来了?

前几天,一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。

Mercury在多项测试中表现亮眼,其生成速度比优化过的GPT-4o Mini、Claude 3.5 Haiku等主流模型快了10倍。更令人惊讶的是,它能在普通NVIDIA H100芯片上达到每秒超过1000token的处理速度,而传统大模型通常需要定制化AI芯片才能达到这一水平。

尽管Mercury的生成质量暂时不及顶级模型,但其超高的效率已令人印象深刻。此外,Mercury采用的扩散模型与传统基于Transformer的大模型完全不同。Transformer遵循人类的链式思维,逐字生成内容;而扩散模型则从模糊到清晰逐步完善细节,这种方法虽然降低了生成精度的可控性,但在速度上具有巨大优势。

Mercury的成功表明,扩散模型或许能成为大语言模型的新方向。然而,Mercury尚未公开技术细节,且在自定义提示词下的表现仍有提升空间。无论如何,Mercury的出现为AI领域提供了全新视角,或许未来扩散模型真的能引领AI发展的新篇章。

原文链接
本文链接:https://kx.umi6.com/article/15432.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
速度秒杀GPT们10倍,国外的DeepSeek时刻来了?
2025-03-14 08:00:03
Mamba一作预告新架构!长文论述Transformer≠最终解法
2025-07-09 14:03:28
谷歌 AI 掌门人 Jeff Dean 对话 Transformer 作者:AI 提速 300%,1000 万倍工程师要来了
2025-02-22 18:43:08
132年未解开的李雅普诺夫函数谜题,被AI攻克了?
2024-10-20 20:02:17
谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
2025-01-14 15:12:54
Transformer危!谷歌MoR架构发布:内存减半推理速度还翻倍
2025-07-17 18:26:53
张亚勤:Transformer五年内会被逐步重构,15-20年内实现AGI | 清华AIR无锡创新中心成立
2024-06-08 15:19:23
Transformer“贡献最大”作者,重返谷歌出任Gemini联合技术主管
2024-08-23 12:33:25
拯救Transformer推理能力,DeepMind新研究TransNAR:给模型嵌入“算法推理大脑”
2024-06-17 17:06:21
扩散语言模型写代码!速度比自回归快10倍
2025-07-10 17:26:44
那个要挑战GPT的00后清华男孩
2024-09-20 11:49:07
全面超越Transformer!清华蚂蚁纯MLP架构,长短程时序预测大提升
2024-06-12 13:13:44
5090跑《黑神话》飙到200+帧,英伟达DLSS也用上Transformer了
2025-01-17 17:20:30
24小时热文
更多
扫一扫体验小程序