1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:万轮实测:GPT-4.5 不如 GPT-4

经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)

最终,GPT-4.5在情商任务上表现不如GPT-4。

原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024-06-21 08:19:03
微软开启 AI 办公新时代:Microsoft 365 Copilot Chat 更名上线
2025-01-16 10:53:32
OpenAI 推出为大学开发的 ChatGPT Edu 教育版,对话和数据不用于训练模型
2024-05-31 12:13:07
24小时热文
更多
扫一扫体验小程序