1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在10月11日,科技媒体The Decoder报道,OpenAI公司推出名为MLE-bench的新基准,旨在评估AI智能体在开发机器学习解决方案的能力。此基准包括75个Kaggle竞赛,涉及多个领域,如自然语言处理、计算机视觉和信号处理。Kaggle是一个专注于数据科学和机器学习的在线竞赛平台,设有从新手到特级大师的不同技能层级。OpenAI在MLE-bench上使用AIDE框架的o1-preview模型,其在16.9%的比赛中至少获得铜牌,超越了Anthropic的Claude 3.5 Sonnet。此模型在7场竞赛中夺金,达到特级大师标准。尽管MLE-bench有局限性,OpenAI仍希望通过此工具推动AI在机器学习领域的进步,基准已公开在GitHub上。这一成就标志着OpenAI在AI竞赛中的新里程碑,展示了AI在解决复杂问题方面的潜力。

原文链接
本文链接:https://kx.umi6.com/article/7289.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI原研究副总裁回归
2026-01-15 10:32:13
OpenAI的「梦醒时分」
2025-12-09 15:41:20
OpenAI:将自行承担“星际之门”项目能源费用
2026-01-21 12:08:12
OpenAI发布GPT最新升级版本GPT-5.2
2025-12-12 03:27:51
GPT-5.2提前泄露?今夜,OpenAI要拿Gemini 3祭天!
2025-12-12 15:54:18
OpenAI据悉今年付费产品计算利润率已提高到70% 高于2024年底的52%
2025-12-22 10:45:11
OpenAI 与晶圆级 AI 芯片企业 Cerebras 达成合作,三年部署 750MW 推理系统
2026-01-15 10:26:49
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
算力越高收入越多!OpenAI率先验证AI商业Scaling Law
2026-01-20 11:02:06
OpenAI、阿里、字节们的AI硬件战事:害怕错过下一代入口
2025-12-06 12:27:46
消息称 OpenAI 正探讨广告方案:回复中给赞助内容更多权重,并确保“克制”
2025-12-24 23:01:58
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
美国甲骨文公司:不会延迟交付为OpenAI建造的数据中心
2025-12-13 20:07:27
24小时热文
更多
扫一扫体验小程序