4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
本文链接:https://kx.umi6.com/article/16642.html
转载请注明文章出处
相关推荐
换一换
快手可灵 2.6“音画同出”模型上线,单次生成可同时产出画面、语音、环境音
2025-12-03 23:48:00
AI混战日
2025-08-06 13:31:19
AI初创公司Sereact获1.1亿美元融资 旨在提升机器人适应性
2026-04-28 00:44:44
领先OpenAI!Anthropic二季度营收预计破789亿元:将成行业首家盈利AI公司
2026-05-21 17:55:42
放开成人内容,OpenAI是为了提升性能?
2025-10-22 17:49:49
谷歌前 CEO 施密特示警:AI 模型极容易被黑客利用
2025-10-11 09:58:07
谷歌掀桌,一口气甩出16个AI王炸
2026-05-22 12:45:33
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
2025-09-01 16:20:02
模型免费、推理翻倍:Gemini 3 Flash 深夜炸场
2025-12-18 12:42:55
国内首个,MiniMax 大模型通过人机辩论图灵测试
2025-07-29 19:34:03
微软CEO称该公司计划于周五发布新的智能体AI模型
2025-12-11 13:53:32
奥尔特曼即将推出新模型“Shallotpeat”,承认谷歌威胁到 OpenAI
2025-11-24 17:06:52
刚刚,让谷歌翻身的Gemini 3,上线Flash版
2025-12-18 11:42:39
715 文章
639337 浏览
24小时热文
更多
-
2026-06-08 23:49:41 -
2026-06-08 21:46:02 -
2026-06-08 19:42:13