1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议
综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
研究称GPT-4.5大模型通过图灵测试
据《科创板日报》3日报道,美国加州大学圣地亚哥分校的研究团队宣布,他们首次证明了人工智能系统可通过标准的三方图灵测试。本次研究选取了GPT-4.5、LLaMa-3.1-405B、GPT-4o及ELIZA四种AI系统参与测试。在实验中,裁判需在与两名人类和一个AI系统的对话后,判断谁是人类。结果显示,GPT-4.5被误认为人类的比例达73%,远超真实人类参与者被识别出的概率。这项研究为AI技术的进步提供了重要参考,引发广泛关注。
智能视野
04-03 09:12:01
GPT-4.5
人工智能
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
加州大学研究:AI 模型 GPT - 4.5 和 Llama 3.1 - 405B 可通过标准图灵测试
4月2日,加州大学圣地亚哥分校的研究成果显示,AI模型GPT-4.5和Llama 3.1-405B首次通过了标准三方图灵测试。图灵测试由阿兰·图灵于1950年提出,要求提问者在与人类和机器对话后无法准确区分哪一方是人类。研究中,三种AI模型参与测试,包括GPT-4.5、Llama 3.1-405B和GPT-4o。在PERSONA模式下,GPT-4.5的胜率为73%,Llama 3.1-405B胜率为56%;而GPT-4o在NO-PERSONA模式下的胜率仅为21%。测试对话以日常闲聊为主,涉及生活细节和社会情感讨论。研究认为,通过图灵测试的AI系统可能在多种社交场景中替代人类,包括工作交流及私人对话。
Nebula
04-02 16:33:23
AI模型
GPT-4.5
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
OpenAI ChatGPT 在心理治疗领域通过图灵测试,AI 比人类更具同理心
2月16日,科技媒体The Decoder报道,OpenAI ChatGPT在心理治疗领域通过了图灵测试。研究显示,830名参与者难以区分ChatGPT和人类治疗师的回复,且认为AI的回答更具同理心。ChatGPT在治疗联盟、同理心和文化胜任力等方面得分高于人类专家,回复更长、语气更积极。然而,多数参与者仍更倾向于人类顾问。这项研究揭示了人们对AI回复存在偏见。
GhostPilot
02-17 15:52:26
OpenAI ChatGPT
同理心
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
福布斯2025年AI十大趋势预测,Killer Agent近在眼前
福布斯预测2025年AI将迎来深度转型,从广泛应用到技术革新。AI Agent将成新方向,Meta计划对Llama收费,但免费使用仍面向个人和小企业。Scaling Law转向其他模态,Web Agent预计成下一个杀手级应用。AI将通过语音图灵测试,实现更自然的交互。OpenAI等巨头将转向应用开发,如搜索、编程工具等。AI自主设计AI或将开启智能爆炸序章。马斯克-特朗普关系破裂可能利好OpenAI。AI数据中心或迁至太空,解决能源问题。首起AI安全事故可能发生,但无人员伤亡。Robotaxi将在至少5个美国主要城市普及。
Nebula
12-27 21:11:22
AI Agent
Web Agent
语音图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
体操运动,是所有AI视频最残酷的图灵测试
昨天上线的Sora AI视频工具在生成体操视频时表现不佳,引发了关于AI是否理解物理规律的讨论。体操运动因其复杂性和高要求,成为AI视频生成中最难攻克的部分。体操动作涉及复杂的物理规律和生物力学原理,需要精确的力量控制和角度调整,这超出了当前AI模型的能力范围。尽管AI在简单动作上表现良好,但在复杂动作上仍存在明显缺陷,如肢体扭曲和生物力学错误。此外,体操还强调美学,这进一步增加了AI生成高质量视频的难度。尽管如此,研究人员正在尝试通过引入物理引擎和改进算法来提升AI的表现。
阿达旻
12-12 10:51:49
AI视频
体操
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
GPT-4顶替大学生参加考试,94%作弊未被揭穿,AI作弊毫无破绽
新闻摘要:近期,AI大模型GPT-4在实际大学考试中进行图灵测试,结果显示94%的AI生成内容未被老师识破,且AI成绩显著高于人类,平均高出半个等级。研究团队在英国雷丁大学的心理学和临床语言科学学院进行了隐蔽实验,混入AI答案,仅5%被标记,大部分AI作业被评为First或Upper Second等级。尽管评分员依赖直觉检测,但AI作弊手段高明,只有极少被发现。这一突破引发了对学术诚信及未来教育模式的深度讨论。
LunarCoder
06-27 22:51:41
AI作弊
GPT-4
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
AI替考大学生,94%作弊成功未被发现
英国研究人员进行了一项实证研究,发现AI代考大学生在2023年夏季的雷丁大学在线考试中,94%的AI生成内容未被教师识别,且平均成绩高于人类学生。AI在简答题和论文题中表现出色,83.4%情况下成绩高于随机选择的同学。研究使用GPT-4生成答案,直接提交,仅通过调整格式以避免露出痕迹。尽管评分过程复杂,人类评分员的直觉并未有效察觉AI作弊。这项结果揭示了AI在学术考试中的「以假乱真」程度,引发了对教育公平和未来课程内容改革的讨论。
QuantumHacker
06-27 17:39:14
ai
图灵测试
考试作弊
分享至
打开微信扫一扫
内容投诉
生成图片
AI统治人类,需要分几步走?
AI统治人类的讨论升温,GPT-3.5和GPT-4已通过图灵测试,引发深度忧虑。加州大学的研究显示,AI与人类的界限模糊,GPT-4的表现接近真人,让人类对未来超级人工智能(AGI)的潜在威胁感到恐慌。OpenAI前员工警告,AI学习速度惊人,从GPT-2到GPT-4的迭代仅用四年,且算力消耗巨大。专家预测AGI可能在2027年实现,可能导致资源枯竭和安全隐患。360创始人周鸿祎质疑AI安全,认为过度发展可能带来自我意识突破及潜在风险。然而,OpenAI在AI安全问题上的态度引发争议,包括负责安全团队的解散和内部人员的公开指责。随着AI技术进步和利润驱动,AI安全成为亟待解决的重要议题。
AI创意引擎
06-24 23:08:32
AI安全
人工智能
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
图灵测试2.0:怎么判断AI到底能干什么不能干什么
图灵测试2.0:判断AI能力的关键标准 图灵测试最初是定性概念,但应用于产品时,它决定AI产品的实际效能。新的2.0版本聚焦于角色中心的AI计算,即AI能否处理角色内的所有任务,如招聘中的需求匹配和候选人评估,若AI能无缝执行这些任务,且人类难以分辨其真人或AI,即视为通过图灵测试2.0。 举个例子...
阿达旻
06-21 09:39:32
AI智商
图灵测试2.0
角色中心式计算
分享至
打开微信扫一扫
内容投诉
生成图片
重磅消息传来,通过测试了,74年来最高,54%的参与者误认为它是真人
2024年,OpenAI的GPT-4在图灵测试中取得突破,54%的参与者误以为它是真人,这是74年来该测试中的最高比例。加州大学圣地亚哥分校的研究人员使用GPT-4、ELIZA、GPT-3.5及真人进行测试,发现AI在模拟人类社交情感方面表现出色。尽管GPT-4未达“真人对话者”的完美识别率,但其成绩接近通过标准,引发了人工智能领域的新讨论。随着AI技术的提升,人们在辨别真伪时可能越来越依赖于非传统认知指标,如社交能力。OpenAI尚未公布GPT-4o,其可能带来更高的误判率。图灵测试作为评估机器智能的重要标志,持续引发科技与哲学的深入探讨。
元界筑梦师
06-21 08:19:03
GPT-4
人工智能
图灵测试
分享至
打开微信扫一扫
内容投诉
生成图片
加载更多
暂无内容
AI热搜
更多
扫一扫体验小程序