1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

2025年9月,OpenAI发布名为GDPval的新基准测试,评估AI模型在真实经济任务中的表现。测试涵盖美国GDP贡献最大的9个行业、44种职业,年创收达3万亿美元。结果显示,Claude Opus 4.1以47.6%的胜率媲美人类专家,排名第一,超越GPT-5(38.8%)。OpenAI承认不同模型各有优势,如GPT-5在准确性上更优,而Claude在文件格式和美观性方面表现突出。研究还发现,模型性能可通过优化提示词和智能体框架显著提升。OpenAI开源了包含220项任务的子集,并提供自动评分服务。此外,微软正与Anthropic合作优化其AI助手,进一步认可Claude的价值。

原文链接
本文链接:https://kx.umi6.com/article/25935.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI芯片核心叛逃Anthropic!就在量产前夜
2026-06-07 20:48:02
OpenAI就第三方库安全事件发布公告:未发现用户数据泄露或系统遭入侵
2026-04-11 09:56:17
OpenAI CEO发文感谢开发者引众怒!程序员痛斥:AI巨头对人类劳动用完即弃
2026-03-19 17:15:35
OpenAI要求谷歌将ChatGPT列为默认搜索引擎之一
2026-03-23 20:45:43
OpenAI发布20颗HBM内存堆栈的芯片专利
2026-04-23 17:19:48
OpenAI首席执行官:AI普及并不会引发“就业末日”
2026-05-26 16:40:26
马斯克死磕奥特曼:赔款我不要,但他必须离开OpenAI董事会
2026-04-09 12:02:49
马斯克诉OpenAI案新进展:微软CEO纳德拉称马斯克从未向其质疑微软投资
2026-05-12 12:09:18
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
截至上月末 OpenAI年化收入突破250亿美元
2026-03-05 12:14:25
福布斯发布2026年AI50榜单:OpenAI、Anthropic领衔 20家公司新上榜
2026-04-21 19:20:40
OpenAI要求加利福尼亚州和特拉华州调查马斯克
2026-04-07 20:17:29
OpenAI关停Sora 奥尔特曼坦言:为了下一代AI 集中计算资源
2026-04-07 20:16:56
24小时热文
更多
扫一扫体验小程序