1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

9月25日,OpenAI发布新基准测试GDPval,评估其AI模型与行业专家的工作表现。结果显示,GPT-5在40.6%的任务中媲美或优于人类,而Anthropic的Claude Opus 4.1在49%的任务中表现相当。测试基于美国GDP贡献最大的九个行业,涵盖44种职业,包括医疗、金融和制造业等。尽管AI尚未全面超越人类,但进步显著:GPT-4o此前仅13.7%胜率,而GPT-5提升了近三倍。OpenAI首席经济学家表示,AI可帮助从业者节省时间,专注于更高价值工作。未来,OpenAI计划扩展测试范围,以覆盖更多复杂任务。

原文链接
本文链接:https://kx.umi6.com/article/25894.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
硅谷画饼王“塌房”:奥特曼撒谎微表情被扒光,网友集体喊下台
2025-08-16 18:29:48
“苹果牌 AI”拥抱 GPT-5,预计下月登陆 iOS / iPadOS / macOS 26
2025-08-09 09:25:46
首个接入GPT-5的视频Agent!一句话生成广告大片,分镜配音全包了
2025-08-26 16:47:05
奥尔特曼最新发声:OpenAI乐于选择亏损 不关心马斯克
2025-08-09 01:22:32
Anthropic 宣布为 Claude 赋予“结束聊天”能力,以应对极少数用户不怀好意的情况
2025-08-17 16:37:59
AI 偏见降低 30%:OpenAI 宣布 GPT-5 是其最中立模型
2025-10-11 10:07:23
OpenAI GPT-5 拥有博士级能力?谷歌 DeepMind CEO:无稽之谈
2025-09-14 17:44:15
Claude 看齐 ChatGPT 新增 AI 自动记忆,能记住你的每一次对话
2025-10-24 09:31:18
杜绝幻觉、拒绝谄媚,GPT-5的「路由革命」
2025-08-11 16:06:06
AI 聊天机器人 Claude 新增跨平台记忆:用户度假归来可追溯上周聊天记录
2025-08-12 10:14:40
GPT-5“让人失望”,AI“撞墙”了吗?
2025-08-17 19:40:29
GPT-5为什么没有带来更多惊喜?
2025-08-10 14:47:11
ChatGPT 为何退回了 4o ?
2025-08-10 15:48:45
24小时热文
更多
扫一扫体验小程序