万轮实测：GPT-4.5不如GPT-4

2025-02-28 21:30:01

万轮实测：GPT-4.5不如GPT-4

神经网络领航员

发布在

科普

阅读：1297

标题：万轮实测：GPT-4.5 不如 GPT-4

经过总计30291次盲测投票，大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史：GPT-1只能生成基本文本，GPT-2较为混乱，GPT-3更为有趣；GPT-3.5达到商用水平并引发“ChatGPT时刻”；GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力，并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示： - 问题一：GPT-4胜出（32.8% vs 25.2%） - 问题二：GPT-4胜出（30.4% vs 23.1%） - 问题三：GPT-4胜出（14% vs 26.1%） - 问题四：GPT-4胜出（16.1% vs 29.5%） - 问题五：GPT-4胜出（29.2% vs 16.1%）

最终，GPT-4.5在情商任务上表现不如GPT-4。

原文链接

本文链接：https://kx.umi6.com/article/14566.html

转载请注明文章出处

GPT-4

GPT-4.5

盲测投票

分享至

打开微信扫一扫

内容投诉

生成图片

神经网络领航员

694 文章

726345 浏览

24小时热文

AI Agent要自己刷卡了但AI 支付宝比想象中更难做为什么？

2026-07-24 00:15:46
“败家”的马斯克：卖车赚的钱全烧给AI了

2026-07-24 00:14:08
不抢电、低耗水、还送免费Codex！OpenAI设法破解AI基建抵制

2026-07-24 00:12:30