1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Gemini 2.5弯道超车的背后

正文:去年,谷歌的Gemini还在追赶,而今年Gemini 2.5 Pro已在多项评测中全面领先。短短一年间,谷歌是如何实现逆袭的?《硅谷101》创始人泓君邀请了Energent.ai联合创始人Kimi Kong和HeyRevia创始人Shaun Wei,与两位前Google技术专家探讨Gemini成功的核心逻辑。

Kimi指出,Gemini 2.5 Pro的卓越表现得益于预训练、监督微调及强化学习对齐三大基础步骤的持续优化。尤其在过去一年,行业将更多精力投入到强化学习,特别是在“人类反馈”和“AI反馈”上的探索,如数学和编程任务中。Google通过多年积累的经验,结合强化学习的创新应用,实现了Gemini在编程、数学等高确定性任务中的出色表现。

在代码生成能力上,Anthropic的代码质量为何优于其他公司?Kimi认为,这源于Anthropic在预训练阶段大量投入高质量代码数据,同时在对齐阶段优先关注编程能力,但也可能导致其在其他能力上的平衡性略显不足。相比之下,Google更注重综合能力的发展。

Gemini的成功离不开几位关键人物。Jeff Dean擅长大规模预训练,Oriol Vinyals在强化学习领域贡献卓著,而Noam Shazeer则在自然语言处理上有深厚积累。三人强强联合,推动了模型能力的全面提升。此外,Google创始人Sergey Brin的回归激发了团队士气,为Gemini的快速崛起注入动力。

在价格竞争方面,Gemini的API成本仅为OpenAI的五分之一甚至十分之一。这得益于Google自研TPU生态、强大的基础设施以及软硬件一体化的优势,使其能够大幅降低运行成本。正如Kimi所说,这种成本优势不仅提升了竞争力,也为开发者提供了更低的接入门槛。

原文链接
本文链接:https://kx.umi6.com/article/19757.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
文生图进入R1时代:港中文发布T2I-R1,让AI绘画“先推理再下笔”
2025-05-14 17:20:57
机器狗能打羽毛球:仅靠强化学习从 0 自学,还会自己移步
2025-05-30 17:53:28
大模型推理学习新范式!ExGRPO框架:从盲目刷题到聪明复盘
2025-10-23 17:10:54
为何强化学习火遍硅谷?AGI的关键一步
2025-08-07 15:55:40
秒级生成百万级token!九章云极发布九章智算云Alaya NeW Cloud 2.0
2025-06-16 19:13:12
Epoch AI 预言:最快 1 年内,推理模型步伐将放缓
2025-05-14 09:09:06
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
中金:2026年大模型在强化学习、模型记忆、上下文工程等方面将取得更多突破
2026-02-05 08:39:59
清华刘知远团队论文:在严格可控环境下重新回答「强化学习能否教会大模型新能力」丨ICLR 2026
2026-02-09 19:27:01
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
OpenAI新模型被曝秘密训练中,o4会是什么样?
2025-06-10 18:54:49
波士顿动力 Spot 四足机器人学会连续后空翻,意外让行走姿态更像真实动物
2025-08-28 10:20:06
DeepSeek-R1 论文登上《自然》封面,通讯作者为梁文锋
2025-09-18 09:48:42
24小时热文
更多
扫一扫体验小程序