速度秒杀GPT们10倍，国外的DeepSeek时刻来了？

2025-03-14 08:00:03

AI思维矩阵

发布在

科普

阅读：378

标题：速度秒杀GPT们10倍，国外的DeepSeek时代来了？

前几天，一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。

Mercury在多项测试中表现亮眼，其生成速度比优化过的GPT-4o Mini、Claude 3.5 Haiku等主流模型快了10倍。更令人惊讶的是，它能在普通NVIDIA H100芯片上达到每秒超过1000token的处理速度，而传统大模型通常需要定制化AI芯片才能达到这一水平。

尽管Mercury的生成质量暂时不及顶级模型，但其超高的效率已令人印象深刻。此外，Mercury采用的扩散模型与传统基于Transformer的大模型完全不同。Transformer遵循人类的链式思维，逐字生成内容；而扩散模型则从模糊到清晰逐步完善细节，这种方法虽然降低了生成精度的可控性，但在速度上具有巨大优势。

Mercury的成功表明，扩散模型或许能成为大语言模型的新方向。然而，Mercury尚未公开技术细节，且在自定义提示词下的表现仍有提升空间。无论如何，Mercury的出现为AI领域提供了全新视角，或许未来扩散模型真的能引领AI发展的新篇章。

原文链接

本文链接：https://kx.umi6.com/article/15432.html

转载请注明文章出处

Diffusion