1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月25日,OpenAI发布新基准测试GDPval,评估其AI模型与行业专家的工作表现。结果显示,GPT-5在40.6%的任务中媲美或优于人类,而Anthropic的Claude Opus 4.1在49%的任务中表现相当。测试基于美国GDP贡献最大的九个行业,涵盖44种职业,包括医疗、金融和制造业等。尽管AI尚未全面超越人类,但进步显著:GPT-4o此前仅13.7%胜率,而GPT-5提升了近三倍。OpenAI首席经济学家表示,AI可帮助从业者节省时间,专注于更高价值工作。未来,OpenAI计划扩展测试范围,以覆盖更多复杂任务。

原文链接
本文链接:https://kx.umi6.com/article/25894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
ChatGPT 为何退回了 4o ?
2025-08-10 15:48:45
GPT-5刚出,人们为什么又怀念GPT-4o
2025-08-11 08:57:55
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
2025-10-20 16:09:01
杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」
2025-08-11 16:06:06
颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞
2025-11-01 23:52:24
OpenAI ChatGPT 更新:GPT-5 引入三种模式,4o 模型回归
2025-08-13 10:31:24
Claude 用户注意:聊天记录将被用于 AI 训练,默认同意
2025-08-29 09:37:27
LMArena排行榜:Claude、GPT-5、智谱GLM-4.6排名并列全球第一
2025-11-13 21:22:57
OpenAI高管自爆:Scaling不死,GPT-5「双轴训练」撕开智能天花板
2025-08-21 15:33:31
GPT-5编程测评大反转
2025-09-23 15:19:23
GPT-5通关《宝可梦水晶》创纪录!9517步击败赤爷,效率碾压o3三倍!
2025-08-26 17:48:25
Claude估值暴涨300%!全球独角兽字节第三他第四
2025-09-03 12:44:37
GPT-5系统提示词被泄露,ChatGPT自己也「承认」了
2025-08-25 18:32:20
24小时热文
更多
扫一扫体验小程序