
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
OpenAI的GPT-4.5刚登顶竞技场,6小时后就被xAI的Grok-3以1分优势反超,两者票数均为3000+,总分1412:1411。Grok-3在总体带风格控制、困难提示词带风格控制方面略逊于GPT-4.5。DeepSeek-R1总分第6,数学和困难提示词带风格控制与GPT-4.5并列第一。有用户质疑6小时内变化是否合理,解释称大模型竞技场有投票门槛。GPT-4.5口碑有所改善,用户开始称赞其情商。奥尔特曼表示收到邮件请求承诺不下架该模型,并分享了与GPT-4.5的对话记录。此外,GPT-4.5还在一个类似大模型狼人杀的另类榜单中表现出色。
原文链接
加载更多

暂无内容