8月5日,谷歌DeepMind在Kaggle Game Arena平台举办“AI国际象棋”比赛,邀请OpenAI、Anthropic、谷歌等顶尖AI模型参赛。比赛为期三天,每日一轮,由国际象棋大师Hikaru Nakamura和流媒体播主Levy Rozman解说。首日战果显示,OpenAI的o4 mini胜Deepseek-R1,o3击败Kimi K2 Instruct,谷歌Gemini 2.5 Pro战胜Claude Opus 4,xAI的Grok4击败Gemini 2.5 Flash。比赛旨在测试顶级AI模型的推理、预见及策略调整能力,采用文本基础格式确保公平性。
原文链接
本文链接:https://kx.umi6.com/article/23079.html
转载请注明文章出处
相关推荐
.png)
换一换
港科大团队开发出新 AI 模型:2 至 4 张 X 光片构建 3D 影像,相比 CT 扫描辐射量降低 99%
2025-07-17 23:30:57
宇树科技创始人王兴兴:目前AI模型难以真正驱动机器人做事
2025-09-11 12:54:53
谷歌推出 Gemini CLI(命令行界面),基于 Gemini 2.5 Pro AI 模型
2025-06-25 23:50:58
有望代表未来旅行票务平台趋势:谷歌推出利用自然语言“AI 订机票”Flight Deals 功能
2025-08-16 16:27:36
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
人类秒懂,AI崩溃:一个简单测试,就让GPT-5、Gemini等顶级模型集体“翻车”
2025-09-10 13:34:35
马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?
2025-07-11 17:46:43
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
2025-05-22 11:27:22
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
2025-07-05 16:00:44
马斯克Grok4笑傲AI象棋大赛
2025-08-07 12:48:20
AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率仅55%
2025-05-29 15:35:22
Nature刊文称“AI可模拟人类心智”,Science同日强烈质疑
2025-07-21 09:14:02
靠AI破解癌症,初创公司融下3000万刀!新目标:建10亿单细胞数据集
2025-08-13 14:33:57
561 文章
259538 浏览
24小时热文
更多

-
2025-10-23 18:14:34
-
2025-10-23 18:13:26
-
2025-10-23 18:12:20