8月5日,谷歌DeepMind在Kaggle Game Arena平台举办“AI国际象棋”比赛,邀请OpenAI、Anthropic、谷歌等顶尖AI模型参赛。比赛为期三天,每日一轮,由国际象棋大师Hikaru Nakamura和流媒体播主Levy Rozman解说。首日战果显示,OpenAI的o4 mini胜Deepseek-R1,o3击败Kimi K2 Instruct,谷歌Gemini 2.5 Pro战胜Claude Opus 4,xAI的Grok4击败Gemini 2.5 Flash。比赛旨在测试顶级AI模型的推理、预见及策略调整能力,采用文本基础格式确保公平性。
原文链接
本文链接:https://kx.umi6.com/article/23079.html
转载请注明文章出处
相关推荐
换一换
人类VS AI:波兰程序员10小时编程马拉松中击败OpenAI!
2025-07-20 19:08:20
资金算力决定论下的「1%」例外
2025-12-09 10:28:45
美国《连线》杂志:再见,GPT5;你好,千问!
2025-12-29 15:27:00
靠AI破解癌症,初创公司融下3000万刀!新目标:建10亿单细胞数据集
2025-08-13 14:33:57
OpenAI 发布 AI 打工人报告:前沿模型完成专家级任务,速度快 100 倍,成本仅 1%
2025-09-27 09:38:47
微软推出其首款自研 AI 模型:MAI-Voice-1 秒级生成音频,MAI-1-preview 剑指 Copilot 文本场景
2025-08-29 08:34:31
成人内容提供商起诉 Meta:指控其利用盗版内容训练 AI 模型
2025-07-29 18:33:38
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
Kimi K2 高速版 AI 模型提速,输出速度最高可达每秒 100 Tokens
2025-08-22 16:51:22
大厂AI各走「开源」路
2025-10-17 09:09:57
马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?
2025-07-11 17:46:43
宇树王兴兴:机器人性能已达标 AI模型称成最大瓶颈
2025-09-11 19:02:35
717 文章
564724 浏览
24小时热文
更多
-
2026-04-24 18:31:29 -
2026-04-24 18:30:24 -
2026-04-24 18:29:17