OpenAI o3被曝智商高达157，比肩爱因斯坦，但却没法证明比人类聪明

2024-12-25 18:12:29

未来笔触

发布在

科普

阅读：1052

一觉醒来，发现AI的智商比肩爱因斯坦。OpenAI新模型o3在Codeforces上的评分达2727，换算成人脑智商约为157，远超普通人类。短短7个月内，从GPT-4o到o3，AI智商飙升42分。

尽管AI表现惊人，但用人类智商测试来衡量并不恰当。传统智商测试基于人类特有的思维模式，涵盖逻辑推理、空间认知等，而AI遵循数据输入、特征提取等路径，形似而神异。苹果公司研究指出，AI模型缺乏真正的形式推理能力，仅在模式匹配上表现出色，但这一机制极为脆弱。

例如，GPT-4o虽在某些测试中表现优异，却常犯基础错误，如分不清9.8和9.11。这说明AI的“智商”更多是计算能力，而非真正智能。图灵测试和门萨测试也存在局限性，过分关注语言交流或特定人群。

因此，评估AI进步应转向解决实际问题的能力。基准测试如GSM8K、MATH、HumanEval等考察数学、编程等，但需避免模型因提前训练而“刷榜”。ARC-AGI测试则评估AI抽象推理和未知任务的学习能力，更具挑战性。

尽管o3在ARC-AGI测试中表现良好，但仍未实现通用人工智能（AGI）。未来应关注AI如何更好地服务于人类社会的实际需求，而非单纯追求高分。

原文链接

本文链接：https://kx.umi6.com/article/10740.html

转载请注明文章出处

OpenAI o3

基准测试

智商测试

分享至

打开微信扫一扫

内容投诉

生成图片

未来笔触

723 文章

777047 浏览

24小时热文