1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:OpenAI重夺竞技场第一,但这波靠的是4o

OpenAI开发者日在新加坡举行,ChatGPT再次更新,取代了刚刚登顶一周的Gemini,重回榜首。这次更新的是“创意写作能力”,官方表示新版ChatGPT-4o能生成更自然、更具吸引力和针对性的文本,提升了文本的相关性和可读性,并增强了处理上传文件的能力。

Karina Nguyen解释称,这是为了改进写作,使其更具创造性,尽管这仍是一个开放的研究问题。新版4o在创意写作方面的得分从1365提升到了1402,其他能力如代码、数学及风格控制等方面也有显著提升。

新版4o在各分榜上的表现亮眼:创意写作从第二升至第一,代码能力从第二升至第一,数学能力从第四升至第三,困难任务从第二升至第一。此外,新版4o在风格控制方面继续保持领先地位。胜率数据显示,新版4o在与Gemini-Exp-1114和Claude 3.5 Sonnet的对比中分别获得了59%和69%的胜率。

尽管如此,一些网友质疑OpenAI的更新策略,认为新版4o只是临时措施,而非真正的突破。有人甚至讽刺道,OpenAI可能只是在查询竞技场排名后,通过更新版本来重新获得第一的位置。不过,也有网友指出,新版4o在敏感话题上的处理有所改善,新增了内容政策查询功能。

如果你有兴趣体验新版4o的创意写作能力,可以访问https://lmarena.ai/?leaderboard,测试结果欢迎在评论区分享。

— 完 —

原文链接
本文链接:https://kx.umi6.com/article/9065.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI在ChatGPT中加载广告,这是一个1.4万亿美元的市场
2026-01-21 13:10:00
美国男子“听信 ChatGPT 谗言”弑母后自杀事件后续:OpenAI 拒交关键聊天记录
2025-12-16 12:37:26
加量不加价:OpenAI 最强编程 AI 模型 API 开放,连续写代码可超 24 小时
2025-12-05 14:33:49
微软打包收购OpenAI?就差一点!
2026-01-21 17:19:03
OpenAI CFO称公司2025年年化收入已突破200亿美元
2026-01-20 10:01:28
OpenAI发布ChatGPT健康 押注万亿AI医疗市场
2026-01-08 16:20:44
OpenAI、SpaceX和Anthropic,三大「超级IPO」或齐聚今年
2026-01-05 18:19:20
OpenAI的「广告模式」已初具雏形
2025-12-25 18:56:39
美国甲骨文公司:不会延迟交付为OpenAI建造的数据中心
2025-12-13 20:07:27
谷歌 Gemini 3 反击战:OpenAI GPT-5.2 被曝提前至下周发布,从新功能转向速度与稳定性提升
2025-12-06 09:19:14
屏幕消失之后:OpenAI的智能硬件新赌注
2026-01-21 08:59:13
姚班传奇陈立杰入职OpenAI!16岁保送清华,30岁拿下UC伯克利助理教授
2026-01-15 15:40:32
OpenAI加码音频人工智能研发 备战首款硬件设备
2026-01-01 23:43:33
24小时热文
更多
扫一扫体验小程序