OpenAI重夺竞技场第一，但这波靠的是4o

2024-11-21 13:31:10

智能涌动

发布在

科普

阅读：580

标题：OpenAI重夺竞技场第一，但这波靠的是4o

OpenAI开发者日在新加坡举行，ChatGPT再次更新，取代了刚刚登顶一周的Gemini，重回榜首。这次更新的是“创意写作能力”，官方表示新版ChatGPT-4o能生成更自然、更具吸引力和针对性的文本，提升了文本的相关性和可读性，并增强了处理上传文件的能力。

Karina Nguyen解释称，这是为了改进写作，使其更具创造性，尽管这仍是一个开放的研究问题。新版4o在创意写作方面的得分从1365提升到了1402，其他能力如代码、数学及风格控制等方面也有显著提升。

新版4o在各分榜上的表现亮眼：创意写作从第二升至第一，代码能力从第二升至第一，数学能力从第四升至第三，困难任务从第二升至第一。此外，新版4o在风格控制方面继续保持领先地位。胜率数据显示，新版4o在与Gemini-Exp-1114和Claude 3.5 Sonnet的对比中分别获得了59%和69%的胜率。

尽管如此，一些网友质疑OpenAI的更新策略，认为新版4o只是临时措施，而非真正的突破。有人甚至讽刺道，OpenAI可能只是在查询竞技场排名后，通过更新版本来重新获得第一的位置。不过，也有网友指出，新版4o在敏感话题上的处理有所改善，新增了内容政策查询功能。

如果你有兴趣体验新版4o的创意写作能力，可以访问https://lmarena.ai/?leaderboard，测试结果欢迎在评论区分享。

— 完 —

原文链接

本文链接：https://kx.umi6.com/article/9065.html

转载请注明文章出处

ChatGPT-4o