4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
原文链接
本文链接:https://kx.umi6.com/article/16642.html
转载请注明文章出处
相关推荐
换一换
全球首款:浙大一院、阿里达摩院发布主动脉急诊 AI 模型,快速识别“最凶险胸痛”
2025-08-27 17:05:25
在训练中给人工智能一种邪恶的“疫苗”,可能会让它变得更好
2025-08-04 20:02:39
谷歌开源抗癌 AI 模型:模拟 4000 种药物后锁定潜在抗癌药
2025-10-16 14:56:03
马斯克的最快AI模型来了
2025-09-16 12:09:37
谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒
2025-05-31 12:05:15
Adobe Firefly 上线移动平台应用:支持文生图 / 视频,可调用第三方 AI 模型
2025-06-17 22:30:24
不听指挥?OpenAI模型被曝拒绝执行人类指令
2025-05-27 11:26:48
微软将对AI模型的“安全性”进行排名
2025-06-09 14:28:33
大厂AI各走「开源」路
2025-10-17 09:09:57
英伟达三大AI重磅产品齐发,GPU服务器性能暴增18倍
2025-08-13 16:37:45
OpenAI 发现 AI 模型隐藏特征:可调控“毒性”行为,助力开发更安全 AI
2025-06-19 09:49:12
重新体验GPT-5后,我想它比GPT-4o 更需要一场葬礼
2025-08-11 19:06:36
Yupp 平台上线:邀用户低成本使用业界各大 AI 模型,收集评测反馈构建排行榜
2025-06-23 15:25:53
593 文章
353548 浏览
24小时热文
更多
-
2025-12-08 22:52:38 -
2025-12-08 22:51:57 -
2025-12-08 22:51:33