1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:Gemini 2.5弯道超车的背后

正文:去年,谷歌的Gemini还在追赶,而今年Gemini 2.5 Pro已在多项评测中全面领先。短短一年间,谷歌是如何实现逆袭的?《硅谷101》创始人泓君邀请了Energent.ai联合创始人Kimi Kong和HeyRevia创始人Shaun Wei,与两位前Google技术专家探讨Gemini成功的核心逻辑。

Kimi指出,Gemini 2.5 Pro的卓越表现得益于预训练、监督微调及强化学习对齐三大基础步骤的持续优化。尤其在过去一年,行业将更多精力投入到强化学习,特别是在“人类反馈”和“AI反馈”上的探索,如数学和编程任务中。Google通过多年积累的经验,结合强化学习的创新应用,实现了Gemini在编程、数学等高确定性任务中的出色表现。

在代码生成能力上,Anthropic的代码质量为何优于其他公司?Kimi认为,这源于Anthropic在预训练阶段大量投入高质量代码数据,同时在对齐阶段优先关注编程能力,但也可能导致其在其他能力上的平衡性略显不足。相比之下,Google更注重综合能力的发展。

Gemini的成功离不开几位关键人物。Jeff Dean擅长大规模预训练,Oriol Vinyals在强化学习领域贡献卓著,而Noam Shazeer则在自然语言处理上有深厚积累。三人强强联合,推动了模型能力的全面提升。此外,Google创始人Sergey Brin的回归激发了团队士气,为Gemini的快速崛起注入动力。

在价格竞争方面,Gemini的API成本仅为OpenAI的五分之一甚至十分之一。这得益于Google自研TPU生态、强大的基础设施以及软硬件一体化的优势,使其能够大幅降低运行成本。正如Kimi所说,这种成本优势不仅提升了竞争力,也为开发者提供了更低的接入门槛。

原文链接
本文链接:https://kx.umi6.com/article/19757.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
腾讯混元再引强将,庞天宇即将入职多模态模型团队负责强化学习前沿算法探索
2026-01-30 15:35:19
缺数据也能拿SOTA?清华&上海AI Lab破解机器人RL两大瓶颈
2025-09-26 11:24:15
我们让GPT玩狼人杀,它特别喜欢杀0号和1号,为什么?
2025-05-23 13:51:09
Dwarkesh最新播客:AI 进展年终总结
2025-12-25 18:54:19
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合
2025-07-24 16:09:58
性能提升84%-166%!L-Zero仅靠强化学习解锁大模型探索世界的能力 | 已开源
2025-07-01 15:26:33
LLM强化学习新框架!UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍
2025-11-08 13:43:06
Claude 4如何思考?资深研究员回应:RLVR已在编程/数学得到验证
2025-05-24 15:19:19
Google这个免费AI编程产品,发布不到1天就翻车?
2025-06-28 19:24:14
OpenAI再强,也挡不住Google往生态里狂塞AI
2025-05-22 16:34:08
奥尔特曼:感受不到 GPT-5 变强,是因为你还不够「专业」
2025-10-05 20:24:55
4o-mini华人领队也离职了,这次不怪小扎
2025-08-19 16:01:05
混元OCR模型核心技术揭秘:统一框架、真端到端
2025-11-30 11:05:21
24小时热文
更多
扫一扫体验小程序