1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:万轮实测:GPT-4.5 不如 GPT-4

经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)

最终,GPT-4.5在情商任务上表现不如GPT-4。

原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
奥尔特曼坦诚 OpenAI 急缺 GPU,GPT-4.5 只能分阶段推出
2025-02-28 10:04:01
OpenAI计划在未来几周内发布GPT-4.5模型 未来将推出整合多项技术的GPT-5
2025-02-13 05:48:34
OpenAI首席技术官:预计几年内“博士级智能”的AI就会出现
2024-06-21 19:34:02
加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
2025-04-02 16:33:23
GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
2024-05-27 18:08:59
OpenAI突发新模型:用GPT改进GPT训练,左脚踩右脚登天,RLHF突破人类能力上限
2024-06-28 11:36:12
谁卡了OpenAI的脖子?
2024-07-03 14:32:20
奥特曼剧透大动作:GPT-4.5马上发布,GPT-5免费畅聊
2025-02-13 11:57:00
OpenAI 揭秘 GPT-4.5 训练:10 万块 GPU,几乎全员上阵,出现“灾难性问题”
2025-04-13 15:43:17
研究称 GPT-4 通过了图灵测试,54% 的人将其误认为真人
2024-06-17 16:16:00
GPT-4私教辅导6周=在校上课2年,新研究:AI辅助越多进步越明显
2025-01-16 16:56:45
GPT-4即将“退役”!OpenAI宣布本月末起它将被GPT-4o替代
2025-04-14 16:42:54
OpenAI公开破解GPT-4思维的新方法,Ilya也参与了!
2024-06-07 20:15:45
24小时热文
更多
扫一扫体验小程序