4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
本文链接:https://kx.umi6.com/article/16642.html
转载请注明文章出处
相关推荐
.png)
换一换
约翰斯・霍普金斯大学研发新 AI 模型,可更准确预测心源性猝死风险
2025-07-05 16:00:44
马斯克力挺 AMD:在中小型 AI 模型方面相当不错,暗示将降低对英伟达依赖
2025-09-13 16:27:30
Anthropic 警告:包括 Claude 在内的大多数 AI 模型会实施“勒索”行为
2025-06-21 09:07:40
浙江大学发布高精准基因组设计AI模型
2025-07-09 11:05:23
Adobe Firefly 上线移动平台应用:支持文生图 / 视频,可调用第三方 AI 模型
2025-06-17 22:30:24
谷歌开源 MedGemma AI 模型,医疗图像与文本分析神器
2025-05-21 15:09:11
这个AI精准模拟人类行为大脑状态,上Nature了
2025-07-15 17:48:52
宇树王兴兴:机器人性能已达标 AI模型称成最大瓶颈
2025-09-11 19:02:35
最新研究:AI已经能在几分钟内通过CFA最难级别考试
2025-09-24 22:51:32
马斯克发布Grok 4,年费飚到2万+
2025-07-10 19:26:08
新研究:人类读指针式时钟准确率达 89.1%,顶尖 AI 仅 13.3%
2025-09-14 16:42:29
GPT-5发布了,到底有没有那么神?
2025-08-08 09:10:02
OpenAI、Anthropic 互评对方 AI 模型:GPT 存在谄媚行为,Claude 不易产生幻觉
2025-08-28 10:18:59
545 文章
267882 浏览
24小时热文
更多

-
2025-10-24 01:20:07
-
2025-10-24 00:18:56
-
2025-10-23 21:15:29