4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
本文链接:https://kx.umi6.com/article/16642.html
转载请注明文章出处
相关推荐
.png)
换一换
从分钟到秒级:Meta Space Llama 模型登陆国际空间站,刷新太空 AI 速度
2025-04-26 09:39:29
OpenAI发布GPT-4.1 ,吊打GPT-4.5,14万/月的博士级AI曝光
2025-04-15 08:22:07
OpenAI发布新款AI模型o3和o4-mini
2025-04-17 01:18:17
卡内基梅隆大学推出 AI 模型“乐高 GPT”,敲敲键盘就能生成可搭建积木
2025-05-09 22:57:27
马斯克最贵AI 首批实测炸了,Grok4一边封神一边翻车,网友:2万块就这?
2025-07-11 17:46:43
谷歌 DeepMind 开发 DolphinGemma AI 模型,助力海豚“语言”研究
2025-04-15 08:21:03
Anthropic 最强 AI 模型 Claude Sonnet 4 / Opus 4 有望明日发布
2025-05-22 11:27:22
没网也能用!谷歌发布离线机器人AI模型:具备视觉识别、语言理解能力
2025-06-26 17:02:10
谷歌 Gemini 2.5 Flash 轻量级模型官宣 6 月到来,2.5 Pro 随后将至
2025-05-21 02:50:49
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
2025-07-05 16:00:44
不听指挥?OpenAI模型被曝拒绝执行人类指令
2025-05-27 11:26:48
只需一张照片,几行代码,o3就让你的生活暴露在大众眼中
2025-04-27 16:21:23
AI 3D大模型Tripo 3.0发布:参数量达200亿 草图秒变3D
2025-08-22 17:51:52
493 文章
163331 浏览
24小时热文
更多

-
2025-09-06 20:38:03
-
2025-09-06 19:37:51
-
2025-09-06 16:37:17