
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
4月24日,OpenAI CEO山姆·奥尔特曼宣布放宽AI模型消息限制。Plus、Team及Enterprise用户每周可使用的o3模型消息数从50条提升至100条,o4-mini每日从150条增至300条,o4-mini-high达每日100条。o3作为OpenAI最强推理模型,专精于复杂分析和视觉任务,在编程、商业咨询及创意构思领域表现优异,较o1减少20%的重大错误。此次调整旨在提供更多灵活性,助力高级查询需求。
原文链接
4月21日,OpenAI的o3模型基准测试成绩遭质疑。去年12月,OpenAI宣称o3能在FrontierMath上正确回答超25%的问题,远超对手。但Epoch研究所的独立测试显示,公开版o3得分仅约10%,低于预期。OpenAI称其高分基于更强计算资源,而Epoch认为测试设置或评估版本不同导致差异。ARC Prize基金会证实公开版o3为调整版,性能较测试版弱。尽管如此,后续o3衍生模型表现更优,OpenAI计划推出更强版本o3-pro。此事凸显AI基准测试的不确定性,类似争议在行业内愈发常见。
原文链接
4月3日,Arc Prize Foundation对OpenAI的o3模型运行成本进行修订,单次任务成本从3000美元涨至3万美元。o3 high配置在ARC-AGI基准测试中,因使用计算资源达o3 low的172倍,导致成本激增。此模型尚未正式发布,OpenAI可能借鉴o1-pro定价模式。专家指出,尽管AI成本低于人工,但模型效率仍有提升空间。AI商业化进程中,平衡性能与成本成为行业挑战。
原文链接
OpenAI后训练团队负责人William Fedus宣布离职创业,将创办一家专注利用AI发现新材料的初创公司。他曾是OpenAI ChatGPT、开发者工具等模型后期训练的主要负责人,主导研发了o1、o1-mini、o1-preview等多个重要模型。离职前,他接替Barret Zoph成为后训练...
原文链接
OpenAI首席产品官凯文・维尔透露,更智能的GPT o3模型有望于2月或3月发布。此外,OpenAI计划在第一季度推出首批AI智能体工具,这些工具将使ChatGPT能够在计算机上执行实际操作。
原文链接
OpenAI发布了旗舰模型o3和o3-mini,成为2024年的收官之作。几乎所有OpenAI员工都在推特上发文支持,展现出全员营销的景象。掌门人奥特曼、联合创始人Greg Brockman等高层纷纷点赞并强调模型的突破性成就。研究员Hongyu Ren详细介绍o3 mini的性能,其他主创也发文表达自豪。OpenAI多模态推理研究员Noam Brown呼吁理性看待模型进展,强调突破不代表达到AGI水平。此外,OpenAI通过集体背书传达了技术仍在持续突破、训练速度未放缓的信息,旨在巩固市场信心。
原文链接
OpenAI的o3模型在Codeforces上获得2727分,相当于智商157,超过99.8%的程序员。这一成绩远超爱因斯坦的估计智商160。o3仅用7个月就提升了42分,而人类需约140年才能达到同样的进步。o3在AIME 2024数学竞赛中得96.7分,远超GPT-4o的13.4分。尽管o3仍处于安全测试阶段,未来AI的发展可能将彻底改变教育和科研领域。
原文链接
标题:o3意味着什么?2025年AI进展加速,但成本更高
AI进入“第二个扩展法则时代”,新方法“测试时扩展”使OpenAI的o3模型表现突出,但也带来了更高的成本。o3在推理阶段使用更多计算资源,导致每个答案成本增加,难以成为日常工具。
具体而言,“测试时扩展”意味着OpenAI在用户提问时使用更多计算芯片或更长时间运行芯片。尽管o3在ARC-AGI基准测试中表现出色,但在简单任务上仍存在问题,未解决大语言模型的幻觉问题。
Clark认为,2025年AI进展将更快,结合“测试时扩展”和传统预训练方法,将进一步提升性能。然而,o3高昂的计算成本限制了其广泛应用,目前仅适合财力雄厚的机构。
尽管如此,o3在ARC-AGI测试中的得分远超其他模型,展示了显著进步。但其高昂的计算成本显示,达到高性能AI模型的门槛依然很高。
原文链接
OpenAI 连续12天的产品发布会展示了多项技术更新,包括完整的推理模型o1、强化微调、文生视频Sora、更强的写作和编程工具Canvas等。然而,发布会初期亮点不多,低于预期。发布会最后一天发布的o3模型表现出色,在多项测试中超越人类专家水平,引发业内震动。尽管如此,模型的商业化和应用落地仍面临数据获取和高昂成本的挑战。此外,OpenAI还宣布了与苹果生态系统的深度整合,并发布了多项新功能以提升用户体验,试图使ChatGPT成为超级AI助手。发布会透露出大模型行业的竞争焦点不仅在于技术参数,也在于用户体验和市场规模。
原文链接
OpenAI发布o3系列模型,提升AI性能边界。
OpenAI发布o3系列,作为o1的迭代版,避免与O2冲突,直接命名为o3。CEO Sam Altman自嘲公司命名混乱。发布会由Altman、Mark Chen及研究科学家任泓宇主持。
o3系列包括OpenAI o3和o3 mini两款模型。前者性能强大,后者轻量级,性价比高。目前,o3系列暂不面向普通用户,仅开放安全测试申请,预计明年1月发布。
o3在多项基准测试中表现出色,如SweepBench、Codeforces、AIME及GPQA Diamond,性能远超o1。尤其在ARC-AGI测试中,o3在不同算力条件下均表现优异。
o3 mini同样具备强大能力,支持多种推理时间模式,编程和数学能力突出。模型将支持函数调用等功能,预计1月全面推出。
总结,o3系列展示了OpenAI的迭代成果,但也面临市场竞争压力,未来充满不确定性。
原文链接
加载更多

暂无内容