2025年9月,OpenAI推出全新评估体系GDPval,通过真实工作任务衡量AI模型的经济潜力。覆盖9大行业、44种职业,涉及3万亿美元经济价值,揭示AI在法律、工程、客服等领域的表现。测试显示,Claude Opus 4.1在近半任务中媲美或超越人类专家,GPT-5则在准确性上领先。顶尖模型完成任务的速度和成本仅为人类的1%。OpenAI还开放了部分数据集与评分平台,旨在推动AI普及与劳动力市场转型,助力人类专注创造性工作。
原文链接
本文链接:https://kx.umi6.com/article/25986.html
转载请注明文章出处
相关推荐
换一换
OpenAI:GPT-5.2/Codex模型的速度现已提升40%
2026-02-04 13:45:40
一道50米洗车题让全网AI翻车 腾讯张军:这或是人机时代新的互相驯化
2026-02-11 14:25:13
1220亿美元!OpenAI创下史上最大单笔融资纪录
2026-04-01 09:34:49
消息称三星将向OpenAI供应HBM4芯片 用于后者首款自研AI处理器
2026-03-19 21:37:07
知道你一切隐私的AI 现在着急卖广告赚钱了
2026-02-13 23:46:20
OpenAI推出Prism 可用于撰写论文和协作研究
2026-01-28 10:18:55
软银集团4-12月净利润增至5倍 创历史同期新高
2026-02-12 16:32:10
中门对狙,这下真的AI春晚了
2026-02-07 09:59:29
OpenAI:关于芯片供应 公司已做到“对未来需求心中有数”
2026-02-20 07:10:46
缺乏实质证据 美国法院暂时驳回xAI针对OpenAI的商业机密侵权指控
2026-02-25 17:42:04
OpenAI推出新平台 助力企业部署“AI同事”
2026-02-06 02:24:03
OpenAI试水广告业务 定价对标高端资源
2026-01-26 23:41:21
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
740 文章
560634 浏览
24小时热文
更多
-
2026-04-24 23:43:31 -
2026-04-24 23:42:26 -
2026-04-24 23:41:21