标题:万轮实测:GPT-4.5 不如 GPT-4
经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。
Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。
结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)
最终,GPT-4.5在情商任务上表现不如GPT-4。
原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
相关推荐
.png)
换一换
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024-06-21 08:19:03
微软开启 AI 办公新时代:Microsoft 365 Copilot Chat 更名上线
2025-01-16 10:53:32
OpenAI 推出为大学开发的 ChatGPT Edu 教育版,对话和数据不用于训练模型
2024-05-31 12:13:07
425 文章
55277 浏览
24小时热文
更多

-
2025-07-19 20:57:00
-
2025-07-19 18:55:37
-
2025-07-19 17:56:25