1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:顶级AI认知能力不及老年人,大模型集体“翻车”

随着AI技术的发展,人们常猜测AI是否会取代人类医生。最近,《英国医学杂志》上的一项研究揭示了一个惊人的发现:AI表现出类似人类轻度认知障碍的症状。

该研究由以色列哈达萨医疗中心团队主导,评估了五种大语言模型的认知能力,包括OpenAI的ChatGPT 4和ChatGPT-4o+、谷歌的Gemini 1.0和1.5,以及Anthropic的Claude 3.5 Sonnet等。结果显示,ChatGPT 4o表现最好,但也仅达到26分的及格线,其余模型分数更低。有趣的是,早期版本的模型表现更差。

评估中,AI在命名、注意力、语言和抽象思维等任务中表现良好,但在视觉空间和执行功能测试中表现欠佳。例如,在连线测试和时钟绘制测试中,AI表现不佳,错误模式与认知障碍患者相似。Gemini模型在记忆测试中也出现“健忘”现象,未能记住先前的五个词。

研究还发现,AI模型处理视觉空间问题的能力有限,对Navon图形和偷饼干图片测试中的复杂场景理解不足。尽管如此,AI在文本分析和抽象推理任务中表现优秀。

这项研究提醒我们,AI在医学领域应用时需谨慎。AI的某些根本性限制可能持续存在,特别是在视觉抽象能力和执行功能方面。未来研究应关注提升AI的共情和情境理解能力,以实现人类智慧与AI优势互补的新格局。

原文链接
本文链接:https://kx.umi6.com/article/11559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI 意识更进一步!谷歌 DeepMind 等:LLM 不仅能感受痛苦还能趋利避害
2025-02-10 13:12:02
Meta前高管警告:AI市场大概率会有一波调整
2025-10-16 20:00:09
下一代 RAG 技术来了,微软正式开源 GraphRAG:大模型行业将迎来新的升级?
2024-07-04 18:52:32
阿里蔡崇信:AI 模型训练过程像教育孩子,某些方面学习三四年可达博士水平
2024-06-01 23:35:23
过去一年,哪些AI模式跑出来了?
2024-08-07 19:19:32
DeepSeek使用技巧,你收藏这一篇就够了
2025-02-07 21:09:11
2000美元一只“草莓”,OpenAI 新模型价格挑战用户底线?
2024-09-06 21:00:01
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
2025-03-23 23:28:58
苹果创新“清单法”:用 AI 大模型当“老师”,教小模型更精准执行复杂指令
2025-08-26 07:38:55
大语言模型火爆的今天,我们为什么还要拥抱世界模型?
2025-04-09 10:42:08
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
2024-11-21 14:34:25
中国科大新成果入选 ICLR 2025:特定领域仅用 5% 训练数据,知识准确率提升 14%
2025-04-07 13:58:54
美团CEO王兴:将继续加大投资开发大语言模型
2025-05-26 21:54:46
24小时热文
更多
扫一扫体验小程序