1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:顶级AI认知能力不及老年人,大模型集体“翻车”

随着AI技术的发展,人们常猜测AI是否会取代人类医生。最近,《英国医学杂志》上的一项研究揭示了一个惊人的发现:AI表现出类似人类轻度认知障碍的症状。

该研究由以色列哈达萨医疗中心团队主导,评估了五种大语言模型的认知能力,包括OpenAI的ChatGPT 4和ChatGPT-4o+、谷歌的Gemini 1.0和1.5,以及Anthropic的Claude 3.5 Sonnet等。结果显示,ChatGPT 4o表现最好,但也仅达到26分的及格线,其余模型分数更低。有趣的是,早期版本的模型表现更差。

评估中,AI在命名、注意力、语言和抽象思维等任务中表现良好,但在视觉空间和执行功能测试中表现欠佳。例如,在连线测试和时钟绘制测试中,AI表现不佳,错误模式与认知障碍患者相似。Gemini模型在记忆测试中也出现“健忘”现象,未能记住先前的五个词。

研究还发现,AI模型处理视觉空间问题的能力有限,对Navon图形和偷饼干图片测试中的复杂场景理解不足。尽管如此,AI在文本分析和抽象推理任务中表现优秀。

这项研究提醒我们,AI在医学领域应用时需谨慎。AI的某些根本性限制可能持续存在,特别是在视觉抽象能力和执行功能方面。未来研究应关注提升AI的共情和情境理解能力,以实现人类智慧与AI优势互补的新格局。

原文链接
本文链接:https://kx.umi6.com/article/11559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
攻略在手,轻松玩转 DeepSeek
2025-02-08 21:33:12
之江实验室薛贵荣:当AI开始做科研,我看到了大语言模型的天花板丨GAIR 2025
2025-12-31 17:32:07
AI 意识更进一步!谷歌 DeepMind 等:LLM 不仅能感受痛苦还能趋利避害
2025-02-10 13:12:02
海洋领域首个业务化垂直领域大语言模型“瀚海智语”发布:基于 360 智脑和 DeepSeek 开发
2025-03-24 16:09:30
罗永浩重返科技行业:AI智能助理J1 Assistant上线
2025-01-05 19:57:49
《自然》杂志研究:AI 追踪他人心理状态能力与人类相当或超越人类
2024-05-27 09:13:10
中国科学院科学家首次证实:大语言模型能像人类一样“理解”事物
2025-06-11 10:10:26
从归因图到AI 的“生物学”:探索Claude3.5 Haiku 的内部机制“中”
2025-06-01 15:22:01
念首诗,就能让AI教你造核弹!Gemini 100%中招
2025-11-25 15:56:13
苹果新研究:AI 不听录音,凭文本描述能零样本识别洗碗等 12 种活动
2025-11-22 08:06:08
荣耀 MagicOS 9.0 升级支持 30 亿参数端侧大语言模型:功耗下降 80%,内存占用减少 1.6GB
2024-10-23 16:40:26
英国格拉斯哥大学哲学研究人员谈“AI 幻觉”:用“胡说八道”来形容更准确
2024-06-12 11:12:49
小红书怎么一夜成为全世界网友都爱的翻译软件?
2025-01-20 21:24:11
24小时热文
更多
扫一扫体验小程序