在科技界的一次重大发现中,谷歌DeepMind的一篇发表于8月的论文揭示了其原理与OpenAI最新模型o1极为相似,引发业界关注。该论文强调,增加测试时(test-time)计算比仅仅扩大模型参数规模更为有效。通过提出计算最优(compute-optimal)测试时计算扩展策略,研究显示,一个规模较小的基础模型在某些任务上能够超越一个14倍大的模型。这一发现迅速在网络上引起热议,有人指出,这几乎就是o1工作原理的体现,暗示着OpenAI可能在抢先发布预览版时已知晓此原理。 同时,OpenAI对此作出快速反应,宣布将o1-mini的速度提高7倍,每日可提供50条服务,而o1-preview的使用频率提升至每周50条。这一举措进一步加速了技术竞争的步伐。 谷歌的研究成果揭示,使用计算最优策略在减少计算量的同时,能显著提升模型性能,最多可节省4倍资源。这与OpenAI的o1模型展现出的策略相吻合,即模型通过完善自身的思维过程、尝试不同策略并学习纠正错误来提升性能,且随着更多强化学习(训练时计算)和思考时间(测试时计算)的增加,性能持续提升。 然而,业界人士也注意到,硬件成为了目前唯一可能形成“护城河”的领域。随着英伟达在算力控制上的主导地位,以及谷歌和微软可能开发出的更优定制芯片,这场技术竞赛似乎正朝着硬件性能的极限冲刺。OpenAI最近曝光的首颗芯片,采用了台积电最先进的A16埃米级工艺,旨在为Sora视频应用提供支持,再次凸显了硬件创新在大模型竞争中的重要性。 总的来说,这场围绕大模型的技术竞赛不仅在模型本身上展开激烈的角逐,还在硬件领域寻求新的突破,以期在竞争中占据优势。
原文链接
本文链接:https://kx.umi6.com/article/6409.html
转载请注明文章出处
相关推荐
换一换
谷歌距4万亿美元仅一步之遥 创始人跃升全球第二、第三富豪
2025-11-26 16:57:14
奥特曼承认谷歌威胁到OpenAI!即将推出新模型“Shallotpeat”
2025-11-24 16:04:37
谷歌Nano Banana Pro亮相:打工人的“图像生成神器”来了!
2025-11-21 01:54:12
AI大模型“新王”加冕 奥尔特曼发来贺电 谷歌做对了什么?
2025-11-19 09:08:26
Gartner首次发布大模型报告:火山引擎排名中国厂商第一
2025-11-20 12:17:36
华尔街尬捧TPU学术界懵了:何恺明5年前就是TPU编程高手,多新鲜
2025-11-30 11:04:10
西部证券:模型端正在演化为“开源阿里、闭源谷歌”的两极强化
2025-11-24 08:47:19
刚刚,让谷歌翻身的Gemini 3,上线Flash版
2025-12-18 11:42:39
AI争霸格局突变?五大“东风”将谷歌送上王座!
2025-11-26 11:41:07
谷歌对OpenAI见招拆招
2025-11-25 00:23:09
谷歌推出新一代图像生成与编辑模型NANO BANANA PRO
2025-11-20 23:50:41
消息称小米研发智能问答助手产品“Mi Chat”
2025-12-09 17:51:08
Gemini3 Flash,谷歌的无解阳谋
2025-12-19 10:42:06
626 文章
382720 浏览
24小时热文
更多
-
2025-12-25 01:09:12 -
2025-12-24 23:01:58 -
2025-12-24 22:00:59