4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
本文链接:https://kx.umi6.com/article/16642.html
转载请注明文章出处
相关推荐
换一换
华为AI模型运行专利公布
2025-09-05 15:25:04
第一时间体验GPT-5,人人免费可用,马斯克表示不服
2025-08-08 06:03:18
腾讯混元开源端到端 AI 模型 Hunyuan-Foley:视频 + 文字 =“电影级”音效
2025-08-28 13:23:33
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
谷歌 2025「复仇爽文」大结局:从至暗时刻到王者归来
2025-12-28 15:30:52
谷歌最强 AI 模型 Gemini 3 正式登场:发布即登顶 LMArena,号称迄今最智能
2025-11-19 08:02:25
谷歌开源抗癌 AI 模型:模拟 4000 种药物后锁定潜在抗癌药
2025-10-16 14:56:03
谷歌推出 Gemini CLI(命令行界面),基于 Gemini 2.5 Pro AI 模型
2025-06-25 23:50:58
新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”
2025-11-08 10:35:27
刚刚,让谷歌翻身的Gemini 3,上线Flash版
2025-12-18 11:42:39
全球首款:浙大一院、阿里达摩院发布主动脉急诊 AI 模型,快速识别“最凶险胸痛”
2025-08-27 17:05:25
OpenAI 发布 AI 打工人报告:前沿模型完成专家级任务,速度快 100 倍,成本仅 1%
2025-09-27 09:38:47
新AI模型助力更准确预测心源性猝死风险
2025-07-05 16:01:14
633 文章
422395 浏览
24小时热文
更多
-
2026-01-23 00:20:44 -
2026-01-22 23:18:34 -
2026-01-22 23:17:29