1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Gemini 2.5弯道超车的背后

正文:去年,谷歌的Gemini还在追赶,而今年Gemini 2.5 Pro已在多项评测中全面领先。短短一年间,谷歌是如何实现逆袭的?《硅谷101》创始人泓君邀请了Energent.ai联合创始人Kimi Kong和HeyRevia创始人Shaun Wei,与两位前Google技术专家探讨Gemini成功的核心逻辑。

Kimi指出,Gemini 2.5 Pro的卓越表现得益于预训练、监督微调及强化学习对齐三大基础步骤的持续优化。尤其在过去一年,行业将更多精力投入到强化学习,特别是在“人类反馈”和“AI反馈”上的探索,如数学和编程任务中。Google通过多年积累的经验,结合强化学习的创新应用,实现了Gemini在编程、数学等高确定性任务中的出色表现。

在代码生成能力上,Anthropic的代码质量为何优于其他公司?Kimi认为,这源于Anthropic在预训练阶段大量投入高质量代码数据,同时在对齐阶段优先关注编程能力,但也可能导致其在其他能力上的平衡性略显不足。相比之下,Google更注重综合能力的发展。

Gemini的成功离不开几位关键人物。Jeff Dean擅长大规模预训练,Oriol Vinyals在强化学习领域贡献卓著,而Noam Shazeer则在自然语言处理上有深厚积累。三人强强联合,推动了模型能力的全面提升。此外,Google创始人Sergey Brin的回归激发了团队士气,为Gemini的快速崛起注入动力。

在价格竞争方面,Gemini的API成本仅为OpenAI的五分之一甚至十分之一。这得益于Google自研TPU生态、强大的基础设施以及软硬件一体化的优势,使其能够大幅降低运行成本。正如Kimi所说,这种成本优势不仅提升了竞争力,也为开发者提供了更低的接入门槛。

原文链接
本文链接:https://kx.umi6.com/article/19757.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Qwen首次公开强化学习核心算法,超越字节GRPO
2025-07-28 15:17:21
最新 AGI 暴论:强化学习的「GPT-3 时刻」实现,还需要 1 万年?
2025-07-14 17:29:16
Google一夜十二次,能否逆袭当回AI界老大
2025-04-10 23:16:02
4B小模型数学推理首超Claude 4,700步RL训练逼近235B性能 | 港大&字节Seed&复旦
2025-07-09 15:04:14
无需外部数据!AI自问自答实现推理能力进化
2025-08-08 16:13:47
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
稚晖君机器人“葡萄缝针”神技再现江湖 这次是人形的
2025-03-11 23:55:21
大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
2025-02-06 16:33:21
姚班学霸、OpenAI姚顺雨:大模型下半场是产品的游戏
2025-04-17 17:47:23
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
2025-08-11 09:58:53
受 DeepSeek-R1 启发,小米大模型团队登顶音频推理 MMAU 榜
2025-03-17 12:37:44
迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单
2025-03-17 12:34:27
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能
2025-05-01 13:22:40
24小时热文
更多
扫一扫体验小程序