
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
8月14日,OpenAI的o3模型在“人工智能国际象棋表演赛”中击败xAI的Grok 4夺冠。比赛在谷歌Kaggle平台举行,八个AI模型经过三天淘汰赛决出胜负。决赛中,o3以4-0零封Grok 4,并在半决赛横扫同门o4 mini。Grok 4虽在前期表现强劲,淘汰了谷歌的Gemini系列模型,但决赛中失误频发。解说嘉宾、国际象棋大师中村光和卡尔森指出,这些AI水平相当于刚学会规则的普通棋手(约800ELO),擅长计算但缺乏战略能力。相较之下,专为国际象棋设计的Stockfish在今年早些时候轻松击败Grok和ChatGPT。
原文链接
2025年8月10日,Kaggle AI国际象棋锦标赛落幕,OpenAI的o3以4比0横扫马斯克旗下xAI的Grok 4,夺得冠军。这场赛事被视为OpenAI与xAI的‘代理人战争’,吸引了全球关注。o3全程未失一局,展现了卓越的战略推理与临场应变能力,而Grok 4则因连续失误遗憾落败。季军战中,谷歌Gemini 2.5 Pro以2.5比1.5击败o4-mini。比赛禁止使用专业引擎,AI需通过自然语言下棋,考验通用推理能力。世界棋王Carlsen评价o3棋力约为1200分,Grok 4仅800分。马斯克称Grok未针对象棋优化。未来,Kaggle计划将评估扩展至围棋等更复杂游戏。
原文链接
微软宣布Copilot用户现可免费无限制访问OpenAI的o3-mini-high深度思考模型。此功能原仅限Pro计划用户使用,现已对所有用户开放。用户只需点击Copilot中的“深度思考”按钮,AI将在约30秒内生成经过充分推理的回复。OpenAI的o3-mini-high模型是其最新、最具成本效益的模型之一,提供更快的性能和更高的效率。
原文链接
一觉醒来,发现AI的智商比肩爱因斯坦。OpenAI新模型o3在Codeforces上的评分达2727,换算成人脑智商约为157,远超普通人类。短短7个月内,从GPT-4o到o3,AI智商飙升42分。
尽管AI表现惊人,但用人类智商测试来衡量并不恰当。传统智商测试基于人类特有的思维模式,涵盖逻辑推理、...
原文链接
OpenAI的o3模型在ARC-AGI基准测试中获得87.5%的高分,但在实际应用中面临高昂的成本挑战。该模型分为低、中、高三种计算级别,高计算级别下性能更优。然而,o3的高计算资源需求导致每次任务需耗费超1000美元,远高于o1模型的5美元。整个测试下来,o3的成本超过1万美元,只有财力雄厚的机构或个人能负担。这意味着o3更适合处理复杂问题,如长期战略决策,而非日常小问题。未来可能需要更高效的AI推理芯片来降低成本。#OpenAI #AI模型
原文链接
标题:OpenAI o3是AGI吗?
OpenAI发布了o3系统,在编程、数学、科学等领域表现出色,尤其在ARC-AGI测试中取得重大突破。这是否意味着2025年能看到AGI的曙光?我们编译了ARC-AGI测试标准创始人撰写的o3测评报告。
OpenAI使用ARC-AGI-1数据集训练o3,半私密评...
原文链接
加载更多

暂无内容