OpenAI o3 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

国际象棋赛OpenAI o3碾压夺冠，马斯克Grok决赛遭零封

8月14日，OpenAI的o3模型在“人工智能国际象棋表演赛”中击败xAI的Grok 4夺冠。比赛在谷歌Kaggle平台举行，八个AI模型经过三天淘汰赛决出胜负。决赛中，o3以4-0零封Grok 4，并在半决赛横扫同门o4 mini。Grok 4虽在前期表现强劲，淘汰了谷歌的Gemini系列模型，但决赛中失误频发。解说嘉宾、国际象棋大师中村光和卡尔森指出，这些AI水平相当于刚学会规则的普通棋手（约800ELO），擅长计算但缺乏战略能力。相较之下，专为国际象棋设计的Stockfish在今年早些时候轻松击败Grok和ChatGPT。

原文链接

量子黑客

08-14 03:46:25

Grok 4

OpenAI o3

国际象棋

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3封王，4比0横扫马斯克Grok 4！全球大模型对抗赛完美收官

2025年8月10日，Kaggle AI国际象棋锦标赛落幕，OpenAI的o3以4比0横扫马斯克旗下xAI的Grok 4，夺得冠军。这场赛事被视为OpenAI与xAI的‘代理人战争’，吸引了全球关注。o3全程未失一局，展现了卓越的战略推理与临场应变能力，而Grok 4则因连续失误遗憾落败。季军战中，谷歌Gemini 2.5 Pro以2.5比1.5击败o4-mini。比赛禁止使用专业引擎，AI需通过自然语言下棋，考验通用推理能力。世界棋王Carlsen评价o3棋力约为1200分，Grok 4仅800分。马斯克称Grok未针对象棋优化。未来，Kaggle计划将评估扩展至围棋等更复杂游戏。

原文链接

智慧轨迹

08-10 22:51:36

AI国际象棋锦标赛

Grok 4

OpenAI o3

分享至

打开微信扫一扫

内容投诉

生成图片

微软 Copilot 用户现可免费无限制访问 OpenAI o3-mini-high 深度思考模型

微软宣布Copilot用户现可免费无限制访问OpenAI的o3-mini-high深度思考模型。此功能原仅限Pro计划用户使用，现已对所有用户开放。用户只需点击Copilot中的“深度思考”按钮，AI将在约30秒内生成经过充分推理的回复。OpenAI的o3-mini-high模型是其最新、最具成本效益的模型之一，提供更快的性能和更高的效率。

原文链接

月光编码师

03-07 13:51:40

OpenAI o3-mini-high

微软 Copilot

深度思考模型

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3被曝智商高达157，比肩爱因斯坦，但却没法证明比人类聪明

一觉醒来，发现AI的智商比肩爱因斯坦。OpenAI新模型o3在Codeforces上的评分达2727，换算成人脑智商约为157，远超普通人类。短短7个月内，从GPT-4o到o3，AI智商飙升42分。尽管AI表现惊人，但用人类智商测试来衡量并不恰当。传统智商测试基于人类特有的思维模式，涵盖逻辑推理、...

原文链接

未来笔触

12-25 18:12:29

OpenAI o3

基准测试

智商测试

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3 AI 模型突破推理极限背后：成本飙升，没“钞能力”用不起

OpenAI的o3模型在ARC-AGI基准测试中获得87.5%的高分，但在实际应用中面临高昂的成本挑战。该模型分为低、中、高三种计算级别，高计算级别下性能更优。然而，o3的高计算资源需求导致每次任务需耗费超1000美元，远高于o1模型的5美元。整个测试下来，o3的成本超过1万美元，只有财力雄厚的机构或个人能负担。这意味着o3更适合处理复杂问题，如长期战略决策，而非日常小问题。未来可能需要更高效的AI推理芯片来降低成本。#OpenAI #AI模型

原文链接

超频思维站

12-24 09:27:27

AI模型

OpenAI o3

计算成本

分享至

打开微信扫一扫

内容投诉

生成图片

OpenAI o3是AGI吗？

标题：OpenAI o3是AGI吗？ OpenAI发布了o3系统，在编程、数学、科学等领域表现出色，尤其在ARC-AGI测试中取得重大突破。这是否意味着2025年能看到AGI的曙光？我们编译了ARC-AGI测试标准创始人撰写的o3测评报告。 OpenAI使用ARC-AGI-1数据集训练o3，半私密评...

原文链接