4月10日消息,OpenAI宣布启动OpenAI先锋计划,目标是改善现有AI模型的评分体系。目前的AI基准测试被认为存在缺陷,无法准确反映模型的实际性能。该计划将聚焦于开发能设定优秀标准的评估体系,特别是在法律、金融、医疗等特定领域。OpenAI计划与多家公司合作,设计定制化基准测试,并在未来几个月内公开这些测试。首批参与者主要来自初创公司,它们将在高价值应用场景中验证AI的实际影响。此外,参与公司可与OpenAI合作,利用强化微调技术优化模型表现。不过,由OpenAI资助并发布的基准测试可能面临社区对其公正性的质疑,尤其是考虑到其过往的类似经历。
原文链接
本文链接:https://kx.umi6.com/article/16915.html
转载请注明文章出处
相关推荐
换一换
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex
2026-01-06 14:06:10
OpenAI 向软银集团旗下数字基础设施公司 SB Energy 投资 5 亿美元
2026-01-10 12:10:02
OpenAI发布ChatGPT健康 押注万亿AI医疗市场
2026-01-08 16:20:44
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
OpenAI首席信息安全官宣布将离职
2026-01-27 14:22:25
分析师:2030年前 OpenAI广告年收入有望达250亿美元
2026-01-20 15:14:56
知道你一切隐私的AI 现在着急卖广告赚钱了
2026-02-13 23:46:20
解码OpenAI的2026
2026-02-04 02:07:37
OpenAI推出新平台 助力企业部署“AI同事”
2026-02-06 02:24:03
OpenAI推出Prism 可用于撰写论文和协作研究
2026-01-28 10:18:55
Anthropic遭遇OpenAI贴身肉搏,上市路多了个坎
2026-01-31 12:30:58
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
OpenAI拟在ChatGPT中测试定向广告加码营收增长计划
2026-01-17 04:09:18
683 文章
481282 浏览
24小时热文
更多
-
2026-03-09 21:13:27 -
2026-03-09 20:09:26 -
2026-03-09 20:09:18