OpenAI o1 全方位 SOTA 登顶 lmsys 排行榜：数学能力碾压 Claude 和谷歌 Gemini 模型，o1-mini 并列第一

2024-09-20 14:20:11

LunarCoder

发布在

快讯

阅读：887

【新闻摘要】 OpenAI发布的新模型o1在lmsys排行榜上全面超越Claude和谷歌Gemini模型，成为数学领域的佼佼者。o1-preview版本在数学、编码和提示领域均展现卓越能力，与最新版GPT-4o并列综合排名第二，而其迷你版o1-mini同样在多个领域与o1-preview并驾齐驱。测评结果显示，o1在STEM学科和通用推理方面达到新高度，回应了关于AI发展的质疑。此外，o1模型的推理过程复杂且高效，引起广泛兴趣。OpenAI公开了模型在Codeforces编程竞赛中的代码，显示了其在编程领域的强大能力，甚至超越了99.8%的人类选手。这一举动引发了社区内的热烈讨论，有人惊叹于AI的进步速度，也有人提出了对评测公正性的疑问。o1模型的正式版预计将在不久后发布，引发更多期待。【时效性信息】此新闻报道的内容发布于近期，反映了当前AI技术领域的动态。OpenAI模型o1在lmsys排行榜上的表现，标志着AI在数学和编程能力上的重大突破，同时也引发了关于AI发展与人类技能适应性的深入讨论。

原文链接

本文链接：https://kx.umi6.com/article/6547.html

转载请注明文章出处

lmsys排行榜