1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:万轮实测:GPT-4.5 不如 GPT-4

经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)

最终,GPT-4.5在情商任务上表现不如GPT-4。

原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
研究称GPT-4通过图灵测试
2024-06-20 18:25:47
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭
2025-03-04 14:11:50
GPT-4.5 登场:OpenAI 最强、最佳 AI 聊天模型,更睿智、更高“情商”、更少幻觉
2025-02-28 06:55:38
人类打辩论不如GPT-4?!Nature子刊:900人实战演练,AI胜率64.4%,还更会说服人
2025-05-25 15:19:25
GPT-4欺骗人类高达99.16%惊人率,PNAS重磅研究曝出,LLM推理越强欺骗值越高
2024-06-11 08:39:03
扳回一局:顶级小说家全方位吊打AI,人类终于赢了
2024-07-19 20:00:47
研究称GPT-4.5大模型通过图灵测试
2025-04-03 09:12:01
OpenAI 揭秘 GPT-4.5 训练:10 万块 GPU,几乎全员上阵,出现“灾难性问题”
2025-04-13 15:43:17
加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
2025-04-02 16:33:23
芝大论文证明 GPT-4 选股准确率高达 60%,人类股票分析师要下岗?AI 大牛质疑数据污染
2024-05-27 13:11:29
OpenAI正推出GPT4.5研究预览版
2025-02-28 03:51:10
GPT-4.5 性能提升有限、成本却激增 30 倍,OpenAI 面临性价比质疑
2025-03-02 15:40:23
持平GPT-4o,毒舌属性拉满,Gork-2是吃了一个马斯克吧
2024-08-16 00:17:34
24小时热文
更多
扫一扫体验小程序