1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI重夺竞技场第一,但这波靠的是4o

OpenAI开发者日在新加坡举行,ChatGPT再次更新,取代了刚刚登顶一周的Gemini,重回榜首。这次更新的是“创意写作能力”,官方表示新版ChatGPT-4o能生成更自然、更具吸引力和针对性的文本,提升了文本的相关性和可读性,并增强了处理上传文件的能力。

Karina Nguyen解释称,这是为了改进写作,使其更具创造性,尽管这仍是一个开放的研究问题。新版4o在创意写作方面的得分从1365提升到了1402,其他能力如代码、数学及风格控制等方面也有显著提升。

新版4o在各分榜上的表现亮眼:创意写作从第二升至第一,代码能力从第二升至第一,数学能力从第四升至第三,困难任务从第二升至第一。此外,新版4o在风格控制方面继续保持领先地位。胜率数据显示,新版4o在与Gemini-Exp-1114和Claude 3.5 Sonnet的对比中分别获得了59%和69%的胜率。

尽管如此,一些网友质疑OpenAI的更新策略,认为新版4o只是临时措施,而非真正的突破。有人甚至讽刺道,OpenAI可能只是在查询竞技场排名后,通过更新版本来重新获得第一的位置。不过,也有网友指出,新版4o在敏感话题上的处理有所改善,新增了内容政策查询功能。

如果你有兴趣体验新版4o的创意写作能力,可以访问https://lmarena.ai/?leaderboard,测试结果欢迎在评论区分享。

— 完 —

原文链接
本文链接:https://kx.umi6.com/article/9065.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
全球算力告急!OpenAI豪掷1450亿疯狂囤算力
2026-04-17 18:16:48
OpenAI关停Sora真实原因曝光:烧钱无底洞 用户留不住
2026-03-31 18:00:04
OpenAI缩减ChatGPT内置购物功能规划
2026-03-05 10:06:59
OpenAI回应TanStack供应链攻击:未发现用户数据泄露
2026-05-14 14:41:58
OpenAI大神教你如何榨干Codex
2026-05-23 18:54:39
菲尔兹奖得主都看懵了:OpenAI非数学模型首次自主突破80年未解数学难题
2026-05-21 17:54:30
OpenAI三位高管同日离职
2026-04-21 00:33:46
OpenAI关停Sora!25个月从封神到退场
2026-03-25 09:11:16
OpenAI要求加利福尼亚州和特拉华州调查马斯克
2026-04-07 20:17:29
OpenAI狂砸500亿美元算力预算 AI军备竞赛全面升级
2026-05-07 12:17:00
OpenAI据悉完成了新AI模型的初步开发
2026-03-25 04:57:32
豪掷200亿美元 OpenAI据称将与芯片新贵Cerebras达成重磅协议
2026-04-17 15:10:16
AWS与OpenAI联合开发“有状态运行时环境” 预计数月内推出
2026-02-28 14:23:02
24小时热文
更多
扫一扫体验小程序