在科技界的一次重大发现中,谷歌DeepMind的一篇发表于8月的论文揭示了其原理与OpenAI最新模型o1极为相似,引发业界关注。该论文强调,增加测试时(test-time)计算比仅仅扩大模型参数规模更为有效。通过提出计算最优(compute-optimal)测试时计算扩展策略,研究显示,一个规模较小的基础模型在某些任务上能够超越一个14倍大的模型。这一发现迅速在网络上引起热议,有人指出,这几乎就是o1工作原理的体现,暗示着OpenAI可能在抢先发布预览版时已知晓此原理。 同时,OpenAI对此作出快速反应,宣布将o1-mini的速度提高7倍,每日可提供50条服务,而o1-preview的使用频率提升至每周50条。这一举措进一步加速了技术竞争的步伐。 谷歌的研究成果揭示,使用计算最优策略在减少计算量的同时,能显著提升模型性能,最多可节省4倍资源。这与OpenAI的o1模型展现出的策略相吻合,即模型通过完善自身的思维过程、尝试不同策略并学习纠正错误来提升性能,且随着更多强化学习(训练时计算)和思考时间(测试时计算)的增加,性能持续提升。 然而,业界人士也注意到,硬件成为了目前唯一可能形成“护城河”的领域。随着英伟达在算力控制上的主导地位,以及谷歌和微软可能开发出的更优定制芯片,这场技术竞赛似乎正朝着硬件性能的极限冲刺。OpenAI最近曝光的首颗芯片,采用了台积电最先进的A16埃米级工艺,旨在为Sora视频应用提供支持,再次凸显了硬件创新在大模型竞争中的重要性。 总的来说,这场围绕大模型的技术竞赛不仅在模型本身上展开激烈的角逐,还在硬件领域寻求新的突破,以期在竞争中占据优势。
原文链接
本文链接:https://kx.umi6.com/article/6409.html
转载请注明文章出处
相关推荐
.png)
换一换
大模型又迎来重要玩家!美团首个开源大模型来了
2025-09-01 18:28:28
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
英伟达新研究:小模型才是智能体的未来
2025-08-19 08:54:39
DeepSeek删豆包冲上热搜,大模型世子之争演都不演了
2025-08-21 13:31:42
阿里、智谱等扎堆发布大模型 编程、金融等方向成焦点
2025-07-30 20:55:52
「今年业务是去年5倍以上」,工业智能体掀热潮
2025-08-29 12:38:30
把枯燥的工作先扔给大模型?
2025-08-15 12:12:45
IDC评测9家座舱大模型产品 斑马获最多项满分推荐
2025-07-18 11:36:59
谷歌发布世界模型Genie 3
2025-08-06 09:28:52
AI每次文本请求仅耗5滴水 谷歌环保账单被质疑美化
2025-08-22 10:50:15
DeepSeek新大招曝光:下一步智能体
2025-09-05 10:15:28
王兴一鸣惊人!美团首个开源大模型追平DeepSeek-V3.1
2025-09-01 13:16:16
OpenAI、谷歌和Anthropic在美国获得民用合同批准
2025-08-05 21:21:41
499 文章
173794 浏览
24小时热文
更多

-
2025-09-07 00:40:01
-
2025-09-06 23:39:46
-
2025-09-06 22:39:24