9月26日,OpenAI发布新基准测试,评估其AI模型与行业专家的工作表现。结果显示,GPT-5-high在40.6%的任务中媲美或超越人类专家,而Anthropic的Claude Opus 4.1在49%的任务中达到类似水平。OpenAI指出,Claude得分更高部分因其擅长生成美观图表,而非单纯性能优势。这一测试凸显AI在专业领域的快速进步,引发对人机协作未来的更多讨论。
原文链接
本文链接:https://kx.umi6.com/article/25900.html
转载请注明文章出处
相关推荐
.png)
换一换
深聊GPT-5发布:过度营销的反噬与AI技术困局
2025-08-13 17:39:40
Claude估值暴涨300%!全球独角兽字节第三他第四
2025-09-03 12:44:37
GPT-5能让普通人变成博士,但魔法依旧没有
2025-08-08 12:10:14
OpenAI的GPT-5会否开启人工智能界的价格大战?
2025-08-11 16:09:01
OpenAI 迄今最智能 AI 模型:“六边形战士”GPT-5 登场,准确性、速度、推理能力等全面突破
2025-08-08 01:59:39
GPT-5编程测评大反转!表面不及格,实际63.1%的任务没交卷,全算上成绩比Claude高一倍
2025-09-24 17:45:44
GPT-5来了,人人免费可用
2025-08-08 08:08:39
OpenAI总裁透露GPT-5改了推理范式,AGI实现要靠现实反馈
2025-08-18 17:48:45
OpenAI今年预计通过ChatGPT实现近100亿美元收入,机构称GPT-5将给硬件和应用端这些企业带来机遇
2025-09-06 16:37:17
GPT-5的拙劣发布,戳破了AI取代公关的谎言
2025-08-12 19:23:40
可调节思考时长,ChatGPT 网页端新增 GPT-5 Thinking 调整功能
2025-09-18 10:48:18
中信建投:GPT-5发布与华为CANN开源有望带动AI应用发展
2025-08-11 09:00:14
GPT-5测试被质疑作弊,故意避开难题刷高分?
2025-08-12 12:18:06
500 文章
195574 浏览
24小时热文
更多

-
2025-09-26 10:24:35
-
2025-09-26 10:23:37
-
2025-09-26 10:22:11