1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:万轮实测:GPT-4.5 不如 GPT-4

经过总计30291次盲测投票,大多数人更喜欢GPT-4。赛博菩萨Andrej Karpathy回顾了GPT系列的发展历史:GPT-1只能生成基本文本,GPT-2较为混乱,GPT-3更为有趣;GPT-3.5达到商用水平并引发“ChatGPT时刻”;GPT-4带来全面提升。

Karpathy设计了5个有趣的prompt来评估非推理能力,并让GPT-4和GPT-4.5分别作答。用户在不知情的情况下进行投票比较。

结果显示: - 问题一:GPT-4胜出(32.8% vs 25.2%) - 问题二:GPT-4胜出(30.4% vs 23.1%) - 问题三:GPT-4胜出(14% vs 26.1%) - 问题四:GPT-4胜出(16.1% vs 29.5%) - 问题五:GPT-4胜出(29.2% vs 16.1%)

最终,GPT-4.5在情商任务上表现不如GPT-4。

原文链接
本文链接:https://kx.umi6.com/article/14566.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
OpenAI 的 GPT-4 变身考证能手:无额外训练通过日本理疗师考试,正确率 73.4%
2024-08-31 09:49:38
奥特曼剧透大动作:GPT-4.5马上发布,GPT-5免费畅聊
2025-02-13 11:57:00
谁卡了OpenAI的脖子?
2024-07-03 14:32:20
GPT-4欺骗人类高达99.16%惊人率,PNAS重磅研究曝出,LLM推理越强欺骗值越高
2024-06-11 08:39:03
杀疯了!6年来最强模型GPT-4.5登场:更贵、更高情商、更少幻觉
2025-02-28 09:00:27
OpenAI 开放 GPT-4o 定制功能,企业可更轻松打造专属 AI 助手
2024-08-21 08:01:20
全球最强模型:OpenAI 被曝 12 月推出 Orion,AI 性能百倍级跃升
2024-10-25 10:46:46
实测GPT-4.5:全网都在喷的OpenAI最贵模型,实际表现怎么样?
2025-02-28 19:25:56
OpenAI最大最贵模型,没把DeepSeek当对手
2025-02-28 18:22:32
OpenAI 揭秘 GPT-4.5 训练:10 万块 GPU,几乎全员上阵,出现“灾难性问题”
2025-04-13 15:43:17
AI可能比你更会炒股?最新研究:GPT-4比人类更擅长金融分析和预测
2024-05-29 14:54:08
万轮实测:GPT-4.5不如GPT-4
2025-02-28 21:30:01
OpenAI突发新模型:用GPT改进GPT训练,左脚踩右脚登天,RLHF突破人类能力上限
2024-06-28 11:36:12
24小时热文
更多
扫一扫体验小程序