摘要: 科技媒体The Decoder于9月19日报告,在聊天机器人竞技场的最新评测中,OpenAI的AI模型o1-preview和o1-mini脱颖而出,问鼎榜首。此次评测涉及数学、复杂提示及编程等任务,结果显示,这两款模型在这些领域表现优异,得分显著超越其他模型,最高达1360分。这表明OpenAI在构建能够处理复杂逻辑推理任务的人工智能模型方面取得了重大进展。 值得注意的是,尽管o1-preview和o1-mini在某些特定任务上的表现亮眼,但它们并未在所有领域均优于如GPT-4o或Anthropic's Claude 3.5等成熟模型。此外,由于参与评测的用户数量相对较少,样本量不足,可能影响结果的准确性,限制了其作为最终评价的参考价值。此次评测的发布日期为9月20日,正值人工智能领域的持续发展和技术创新之际,为行业提供了新的基准和参考。
原文链接
本文链接:https://kx.umi6.com/article/6536.html
转载请注明文章出处
相关推荐
换一换
OpenAI拟运用AI助力药企研发并从中获利
2026-02-04 08:29:27
OpenAI原研究副总裁回归
2026-01-15 10:32:13
光顾赚钱不搞研究,OpenAI元老级高管现离职潮,Mark Chen紧急回应
2026-02-04 15:48:22
知道你一切隐私的AI 现在着急卖广告赚钱了
2026-02-13 23:46:20
OpenAI ChatGPT 将引入广告“供养”AGI,奥尔特曼承诺不干扰 AI 答案生成
2026-01-17 10:22:14
OpenAI据悉考虑与北约签订合同
2026-03-04 14:47:17
OpenAI正敲定1000亿美元巨额融资轮的首批投资承诺
2026-02-19 11:19:20
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
OpenAI下调算力支出目标至6000亿美元 推进新一轮巨额融资
2026-02-21 09:21:56
OpenAI:自本周五起将关闭五款旧版ChatGPT模型的使用权限
2026-02-14 16:30:00
消息称 OpenAI 要求外包人员上传真实工作成果,律师警告称风险极高
2026-01-12 09:24:27
软银据悉寻求最高400亿美元贷款 用于投资OpenAI
2026-03-06 13:02:04
OpenAI前高管坦言公司“掉链子” 让竞争对手谷歌得以翻身
2026-01-24 00:23:19
702 文章
500558 浏览
24小时热文
更多
-
2026-03-10 13:19:24 -
2026-03-10 13:18:55 -
2026-03-10 12:13:43