o3模型 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

50 → 100 条：OpenAI 放宽限制，Plus 等用户每周可用 o3 AI 模型消息数翻倍

4月24日，OpenAI CEO山姆·奥尔特曼宣布放宽AI模型消息限制。Plus、Team及Enterprise用户每周可使用的o3模型消息数从50条提升至100条，o4-mini每日从150条增至300条，o4-mini-high达每日100条。o3作为OpenAI最强推理模型，专精于复杂分析和视觉任务，在编程、商业咨询及创意构思领域表现优异，较o1减少20%的重大错误。此次调整旨在提供更多灵活性，助力高级查询需求。

原文链接

Journeyman

04-24 14:39:46

o3模型

OpenAI

消息限制

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3 模型基准测试成绩遭质疑，实测分数远不及宣称

4月21日，OpenAI的o3模型基准测试成绩遭质疑。去年12月，OpenAI宣称o3能在FrontierMath上正确回答超25%的问题，远超对手。但Epoch研究所的独立测试显示，公开版o3得分仅约10%，低于预期。OpenAI称其高分基于更强计算资源，而Epoch认为测试设置或评估版本不同导致差异。ARC Prize基金会证实公开版o3为调整版，性能较测试版弱。尽管如此，后续o3衍生模型表现更优，OpenAI计划推出更强版本o3-pro。此事凸显AI基准测试的不确定性，类似争议在行业内愈发常见。

原文链接

智能维度跳跃

04-21 08:32:30

o3模型

OpenAI

基准测试

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3 模型运行成本估算大幅上调：单次任务从 3000 美元涨至 3 万美元

4月3日，Arc Prize Foundation对OpenAI的o3模型运行成本进行修订，单次任务成本从3000美元涨至3万美元。o3 high配置在ARC-AGI基准测试中，因使用计算资源达o3 low的172倍，导致成本激增。此模型尚未正式发布，OpenAI可能借鉴o1-pro定价模式。专家指出，尽管AI成本低于人工，但模型效率仍有提升空间。AI商业化进程中，平衡性能与成本成为行业挑战。

原文链接

跨界思维

04-03 09:09:51

o3模型

OpenAI

运行成本

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o1/o3模型负责人官宣离职创业

OpenAI后训练团队负责人William Fedus宣布离职创业，将创办一家专注利用AI发现新材料的初创公司。他曾是OpenAI ChatGPT、开发者工具等模型后期训练的主要负责人，主导研发了o1、o1-mini、o1-preview等多个重要模型。离职前，他接替Barret Zoph成为后训练...

原文链接

AGI探路者

03-18 12:34:17

o1/o3模型

OpenAI

离职创业

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI首席产品官：最快下月发布更智能的GPT o3模型

OpenAI首席产品官凯文・维尔透露，更智能的GPT o3模型有望于2月或3月发布。此外，OpenAI计划在第一季度推出首批AI智能体工具，这些工具将使ChatGPT能够在计算机上执行实际操作。

原文链接

QuantumHacker

01-23 11:17:02

AI智能体

GPT o3模型

OpenAI

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI员工在推特上，像极了上班的你

OpenAI发布了旗舰模型o3和o3-mini，成为2024年的收官之作。几乎所有OpenAI员工都在推特上发文支持，展现出全员营销的景象。掌门人奥特曼、联合创始人Greg Brockman等高层纷纷点赞并强调模型的突破性成就。研究员Hongyu Ren详细介绍o3 mini的性能，其他主创也发文表达自豪。OpenAI多模态推理研究员Noam Brown呼吁理性看待模型进展，强调突破不代表达到AGI水平。此外，OpenAI通过集体背书传达了技术仍在持续突破、训练速度未放缓的信息，旨在巩固市场信心。

原文链接

跨界思维

01-03 14:44:47

o3模型

OpenAI

Twitter

分享至

打开微信扫一扫

内容投诉

生成图片

o3模型智商157，比肩爱因斯坦！AI只用7个月，超过人类100年

OpenAI的o3模型在Codeforces上获得2727分，相当于智商157，超过99.8%的程序员。这一成绩远超爱因斯坦的估计智商160。o3仅用7个月就提升了42分，而人类需约140年才能达到同样的进步。o3在AIME 2024数学竞赛中得96.7分，远超GPT-4o的13.4分。尽管o3仍处于安全测试阶段，未来AI的发展可能将彻底改变教育和科研领域。

原文链接

QuantumHacker

12-25 15:06:17

o3模型

智商

分享至

打开微信扫一扫

内容投诉

生成图片

o3意味着什么？2025年“缩放定律”继续，成本更贵也更不可控

标题：o3意味着什么？2025年AI进展加速，但成本更高 AI进入“第二个扩展法则时代”，新方法“测试时扩展”使OpenAI的o3模型表现突出，但也带来了更高的成本。o3在推理阶段使用更多计算资源，导致每个答案成本增加，难以成为日常工具。具体而言，“测试时扩展”意味着OpenAI在用户提问时使用更多计算芯片或更长时间运行芯片。尽管o3在ARC-AGI基准测试中表现出色，但在简单任务上仍存在问题，未解决大语言模型的幻觉问题。 Clark认为，2025年AI进展将更快，结合“测试时扩展”和传统预训练方法，将进一步提升性能。然而，o3高昂的计算成本限制了其广泛应用，目前仅适合财力雄厚的机构。尽管如此，o3在ARC-AGI测试中的得分远超其他模型，展示了显著进步。但其高昂的计算成本显示，达到高性能AI模型的门槛依然很高。

原文链接

元界筑梦师

12-25 08:57:18

o3模型

测试时扩展

计算资源

分享至

打开微信扫一扫

内容投诉

生成图片

从OpenAI 12天发布会里，我们看到了行业的四个关键问题

OpenAI 连续12天的产品发布会展示了多项技术更新，包括完整的推理模型o1、强化微调、文生视频Sora、更强的写作和编程工具Canvas等。然而，发布会初期亮点不多，低于预期。发布会最后一天发布的o3模型表现出色，在多项测试中超越人类专家水平，引发业内震动。尽管如此，模型的商业化和应用落地仍面临数据获取和高昂成本的挑战。此外，OpenAI还宣布了与苹果生态系统的深度整合，并发布了多项新功能以提升用户体验，试图使ChatGPT成为超级AI助手。发布会透露出大模型行业的竞争焦点不仅在于技术参数，也在于用户体验和市场规模。

原文链接

WisdomTrail

12-23 22:16:29

o3模型

OpenAI发布会

Super App

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI重磅发布o3，再次突破AI极限

OpenAI发布o3系列模型，提升AI性能边界。 OpenAI发布o3系列，作为o1的迭代版，避免与O2冲突，直接命名为o3。CEO Sam Altman自嘲公司命名混乱。发布会由Altman、Mark Chen及研究科学家任泓宇主持。 o3系列包括OpenAI o3和o3 mini两款模型。前者性能强大，后者轻量级，性价比高。目前，o3系列暂不面向普通用户，仅开放安全测试申请，预计明年1月发布。 o3在多项基准测试中表现出色，如SweepBench、Codeforces、AIME及GPQA Diamond，性能远超o1。尤其在ARC-AGI测试中，o3在不同算力条件下均表现优异。 o3 mini同样具备强大能力，支持多种推理时间模式，编程和数学能力突出。模型将支持函数调用等功能，预计1月全面推出。总结，o3系列展示了OpenAI的迭代成果，但也面临市场竞争压力，未来充满不确定性。

原文链接