OpenAI 发布 AI 打工人报告：前沿模型完成专家级任务，速度快 100 倍，成本仅 1%

2025-09-27 09:38:47

小阳哥

发布在

快讯

阅读：1266

9月26日，OpenAI发布全新AI评估基准GDPval，用于衡量前沿模型在真实经济价值任务中的表现。该基准覆盖美国九大行业44个职业的1320项任务，由资深专业人士设计，确保真实性与复杂性。与传统评测不同，GDPval要求模型完成多模态交付物，如文件处理、幻灯片生成等。首轮测试显示，Claude Opus 4.1综合性能最佳，GPT-5在特定领域准确性领先。研究表明，前沿模型完成任务速度比专家快100倍，成本仅1%。但OpenAI指出，数据未包含人工监督等现实因素，且目前基准局限在一次性任务，未来将扩展至更复杂场景并开放部分数据集供研究。

原文链接

本文链接：https://kx.umi6.com/article/25970.html

转载请注明文章出处

AI模型