1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在10月11日,科技媒体The Decoder报道,OpenAI公司推出名为MLE-bench的新基准,旨在评估AI智能体在开发机器学习解决方案的能力。此基准包括75个Kaggle竞赛,涉及多个领域,如自然语言处理、计算机视觉和信号处理。Kaggle是一个专注于数据科学和机器学习的在线竞赛平台,设有从新手到特级大师的不同技能层级。OpenAI在MLE-bench上使用AIDE框架的o1-preview模型,其在16.9%的比赛中至少获得铜牌,超越了Anthropic的Claude 3.5 Sonnet。此模型在7场竞赛中夺金,达到特级大师标准。尽管MLE-bench有局限性,OpenAI仍希望通过此工具推动AI在机器学习领域的进步,基准已公开在GitHub上。这一成就标志着OpenAI在AI竞赛中的新里程碑,展示了AI在解决复杂问题方面的潜力。

原文链接
本文链接:https://kx.umi6.com/article/7289.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI:GPT-5.2/Codex模型的速度现已提升40%
2026-02-04 13:45:40
OpenAI已建立人形机器人实验室 启动以来规模扩大四倍多
2026-01-22 21:11:56
OpenAI前高管坦言公司“掉链子” 让竞争对手谷歌得以翻身
2026-01-24 00:23:19
光顾赚钱不搞研究,OpenAI元老级高管现离职潮,Mark Chen紧急回应
2026-02-04 15:48:22
OpenAI从前首席技术官Murati的AI创企挖走三名员工
2026-01-15 16:46:18
OpenAI:推出用户年龄预测功能 以保护未成年用户
2026-01-21 15:17:45
亚马逊据悉正在商谈向OpenAI投资高达500亿美元并扩大合作关系
2026-01-30 09:18:25
GPT-5.4发布:OpenAI首个大一统模型,简直是龙虾原生
2026-03-06 09:42:29
缺乏实质证据 美国法院暂时驳回xAI针对OpenAI的商业机密侵权指控
2026-02-25 17:42:04
OpenAI 回应 ChatGPT 出现广告:平台 95% 是免费用户,会坚守一些原则
2026-01-21 13:13:21
OpenAI 首款硬件设备被曝为 AI 耳机,首年有望出货 4000~5000 万台
2026-01-21 12:05:04
OpenAI战略大转舵 全速冲刺ChatGPT商业化
2026-02-03 13:39:40
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
24小时热文
更多
扫一扫体验小程序