1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

在10月11日,科技媒体The Decoder报道,OpenAI公司推出名为MLE-bench的新基准,旨在评估AI智能体在开发机器学习解决方案的能力。此基准包括75个Kaggle竞赛,涉及多个领域,如自然语言处理、计算机视觉和信号处理。Kaggle是一个专注于数据科学和机器学习的在线竞赛平台,设有从新手到特级大师的不同技能层级。OpenAI在MLE-bench上使用AIDE框架的o1-preview模型,其在16.9%的比赛中至少获得铜牌,超越了Anthropic的Claude 3.5 Sonnet。此模型在7场竞赛中夺金,达到特级大师标准。尽管MLE-bench有局限性,OpenAI仍希望通过此工具推动AI在机器学习领域的进步,基准已公开在GitHub上。这一成就标志着OpenAI在AI竞赛中的新里程碑,展示了AI在解决复杂问题方面的潜力。

原文链接
本文链接:https://kx.umi6.com/article/7289.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 放宽 ChatGPT 成人内容引争议,奥尔特曼回应称“我们不是世界道德警察”
2025-10-16 10:51:00
算力成最大技术瓶颈,OpenAI 首款 AI 硬件恐推迟发布
2025-10-06 10:35:13
OpenAI 研究人员夸大 GPT-5 数学能力后删帖,遭杨立昆等业界人士批评
2025-10-19 08:45:17
OpenAI 奥尔特曼拟用 Sora“变现”,借助 AI 生成视频来盈利
2025-10-04 11:59:56
OpenAI设立秘密项目 训练AI接手初级银行家的繁琐工作
2025-10-21 21:32:06
巨额采购订单不断,OpenAI“停不下来”
2025-10-14 10:15:04
OpenAI已砸1万亿美元 苏姿丰否认AI泡沫化:别太狭隘
2025-10-09 09:20:15
日本政府要求 OpenAI 不得通过 Sora 2 等实施任何可能侵犯版权的行为
2025-10-13 08:54:25
AI最大赢家!研究预测:OpenAI将独揽AI市场1/4收入
2025-10-15 18:42:47
OpenAI 的网络浏览器:ChatGPT Atlas 正式发布,能让 AI“替你上网”
2025-10-22 02:34:53
OpenAI和博通宣布战略合作 博通盘前涨12%
2025-10-13 22:04:43
OpenAI“解禁”成人内容,是福是祸?
2025-10-16 14:58:22
OpenAI 今年推出 GPT - 6?员工否认
2025-10-19 07:43:54
24小时热文
更多
扫一扫体验小程序