1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:速度秒杀GPT们10倍,国外的DeepSeek时代来了?

前几天,一家名不见经传的小公司Inception Labs发布了一个重磅消息——他们推出了全球首个商业级扩散大模型Mercury。Mercury或许将彻底改变大模型过去三年多的发展路径。

Mercury在多项测试中表现亮眼,其生成速度比优化过的GPT-4o Mini、Claude 3.5 Haiku等主流模型快了10倍。更令人惊讶的是,它能在普通NVIDIA H100芯片上达到每秒超过1000token的处理速度,而传统大模型通常需要定制化AI芯片才能达到这一水平。

尽管Mercury的生成质量暂时不及顶级模型,但其超高的效率已令人印象深刻。此外,Mercury采用的扩散模型与传统基于Transformer的大模型完全不同。Transformer遵循人类的链式思维,逐字生成内容;而扩散模型则从模糊到清晰逐步完善细节,这种方法虽然降低了生成精度的可控性,但在速度上具有巨大优势。

Mercury的成功表明,扩散模型或许能成为大语言模型的新方向。然而,Mercury尚未公开技术细节,且在自定义提示词下的表现仍有提升空间。无论如何,Mercury的出现为AI领域提供了全新视角,或许未来扩散模型真的能引领AI发展的新篇章。

原文链接
本文链接:https://kx.umi6.com/article/15432.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
揭秘注意力机制真正起源!10年前3项研究几乎同时独立提出,背后故事细节被Karpathy晒邮件公开了
2024-12-04 16:39:33
一个「always」站在大模型技术C位的传奇男子
2025-05-10 12:04:35
谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
2024-12-04 22:48:59
24小时热文
更多
扫一扫体验小程序