1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月25日,OpenAI发布新基准测试GDPval,评估其AI模型与行业专家的工作表现。结果显示,GPT-5在40.6%的任务中媲美或优于人类,而Anthropic的Claude Opus 4.1在49%的任务中表现相当。测试基于美国GDP贡献最大的九个行业,涵盖44种职业,包括医疗、金融和制造业等。尽管AI尚未全面超越人类,但进步显著:GPT-4o此前仅13.7%胜率,而GPT-5提升了近三倍。OpenAI首席经济学家表示,AI可帮助从业者节省时间,专注于更高价值工作。未来,OpenAI计划扩展测试范围,以覆盖更多复杂任务。

原文链接
本文链接:https://kx.umi6.com/article/25894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI:GPT-5 模型正开始减轻科学家日常工作量
2025-11-22 00:51:13
OpenAI:正在让 GPT-5 变得“更温暖、更友好、不奉承”
2025-08-16 12:24:21
真·博士水平!GPT-5首次给出第四矩定理显式收敛率,数学教授只点拨了一下
2025-09-10 17:40:34
OpenAI 研究人员夸大 GPT-5 数学能力后删帖,遭杨立昆等业界人士批评
2025-10-19 08:45:17
OpenAI首个GPT-5找Bug智能体:全自动读代码找漏洞写修复
2025-10-31 13:33:18
OpenAI两位首席最新采访信息量好大
2025-09-28 19:59:09
Claude 用户注意:聊天记录将被用于 AI 训练,默认同意
2025-08-29 09:37:27
88岁图灵奖得主,用Claude一小时破解30年数学悬案
2026-03-09 13:41:57
Claude第一款AI桌宠硬件,深圳制造
2026-04-27 18:28:00
ChatGPT和Claude,已经不是同一条路上的玩家了
2025-09-17 18:33:53
奥特曼神秘晚宴讲话曝出!OpenAI的CEO或将是个AI,Chrome我也想买
2025-08-17 15:36:36
每天都和 AI 聊天,你可能已经是个「神经病」
2025-11-03 13:20:42
OpenAI 的最强对手,离「AI Windows」又近了一步
2026-01-29 11:13:26
24小时热文
更多
扫一扫体验小程序