1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
国际象棋赛OpenAI o3碾压夺冠,马斯克Grok决赛遭零封
8月14日,OpenAI的o3模型在“人工智能国际象棋表演赛”中击败xAI的Grok 4夺冠。比赛在谷歌Kaggle平台举行,八个AI模型经过三天淘汰赛决出胜负。决赛中,o3以4-0零封Grok 4,并在半决赛横扫同门o4 mini。Grok 4虽在前期表现强劲,淘汰了谷歌的Gemini系列模型,但决赛中失误频发。解说嘉宾、国际象棋大师中村光和卡尔森指出,这些AI水平相当于刚学会规则的普通棋手(约800ELO),擅长计算但缺乏战略能力。相较之下,专为国际象棋设计的Stockfish在今年早些时候轻松击败Grok和ChatGPT。
量子黑客
08-14 03:46:25
Grok 4
OpenAI o3
国际象棋
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官
2025年8月10日,Kaggle AI国际象棋锦标赛落幕,OpenAI的o3以4比0横扫马斯克旗下xAI的Grok 4,夺得冠军。这场赛事被视为OpenAI与xAI的‘代理人战争’,吸引了全球关注。o3全程未失一局,展现了卓越的战略推理与临场应变能力,而Grok 4则因连续失误遗憾落败。季军战中,谷歌Gemini 2.5 Pro以2.5比1.5击败o4-mini。比赛禁止使用专业引擎,AI需通过自然语言下棋,考验通用推理能力。世界棋王Carlsen评价o3棋力约为1200分,Grok 4仅800分。马斯克称Grok未针对象棋优化。未来,Kaggle计划将评估扩展至围棋等更复杂游戏。
智慧轨迹
08-10 22:51:36
AI国际象棋锦标赛
Grok 4
OpenAI o3
分享至
打开微信扫一扫
内容投诉
生成图片
微软 Copilot 用户现可免费无限制访问 OpenAI o3-mini-high 深度思考模型
微软宣布Copilot用户现可免费无限制访问OpenAI的o3-mini-high深度思考模型。此功能原仅限Pro计划用户使用,现已对所有用户开放。用户只需点击Copilot中的“深度思考”按钮,AI将在约30秒内生成经过充分推理的回复。OpenAI的o3-mini-high模型是其最新、最具成本效益的模型之一,提供更快的性能和更高的效率。
月光编码师
03-07 13:51:40
OpenAI o3-mini-high
微软 Copilot
深度思考模型
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI o3被曝智商高达157,比肩爱因斯坦,但却没法证明比人类聪明
一觉醒来,发现AI的智商比肩爱因斯坦。OpenAI新模型o3在Codeforces上的评分达2727,换算成人脑智商约为157,远超普通人类。短短7个月内,从GPT-4o到o3,AI智商飙升42分。 尽管AI表现惊人,但用人类智商测试来衡量并不恰当。传统智商测试基于人类特有的思维模式,涵盖逻辑推理、...
未来笔触
12-25 18:12:29
OpenAI o3
基准测试
智商测试
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI o3 AI 模型突破推理极限背后:成本飙升,没“钞能力”用不起
OpenAI的o3模型在ARC-AGI基准测试中获得87.5%的高分,但在实际应用中面临高昂的成本挑战。该模型分为低、中、高三种计算级别,高计算级别下性能更优。然而,o3的高计算资源需求导致每次任务需耗费超1000美元,远高于o1模型的5美元。整个测试下来,o3的成本超过1万美元,只有财力雄厚的机构或个人能负担。这意味着o3更适合处理复杂问题,如长期战略决策,而非日常小问题。未来可能需要更高效的AI推理芯片来降低成本。#OpenAI #AI模型
超频思维站
12-24 09:27:27
AI模型
OpenAI o3
计算成本
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI o3是AGI吗?
标题:OpenAI o3是AGI吗? OpenAI发布了o3系统,在编程、数学、科学等领域表现出色,尤其在ARC-AGI测试中取得重大突破。这是否意味着2025年能看到AGI的曙光?我们编译了ARC-AGI测试标准创始人撰写的o3测评报告。 OpenAI使用ARC-AGI-1数据集训练o3,半私密评...
LunarCoder
12-21 14:58:33
AGI
ARC-AGI
OpenAI o3
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序