1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:万轮实测:GPT-4.5 不如 GPT-4

经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)

最终,GPT-4.5在情商任务上表现不如GPT-4。

原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI突发新模型,用GPT-4给GPT-4“找茬”
2024-06-28 15:28:02
ChatGPT有望年底发布下一代模型 比GPT-4强100倍
2024-09-05 15:27:26
比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座
2024-10-29 11:24:12
DeepSeek,5连发
2025-02-24 13:26:57
OpenAI推出GPT4.5研究预览版:迄今最大的模型
2025-02-28 07:57:50
扳回一局:顶级小说家全方位吊打AI,人类终于赢了
2024-07-19 20:00:47
杀疯了!6年来最强模型GPT-4.5登场:更贵、更高情商、更少幻觉
2025-02-28 09:00:27
AI可能比你更会炒股?最新研究:GPT-4比人类更擅长金融分析和预测
2024-05-29 14:54:08
OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
2025-02-28 05:54:27
研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人
2024-06-17 16:16:00
起猛了,GPT-4o被谷歌新模型击败,ChatGPT官号:大家深吸一口气
2024-08-02 14:54:04
Ilya参与,OpenAI给GPT-4搞可解释,提取了1600万个特征,还能看它怎么想
2024-06-07 16:37:36
GPT-4即将“退役”
2025-04-15 11:26:27
24小时热文
更多
扫一扫体验小程序