顶级AI认知能力输给老年人，大模型集体翻车

2025-01-13 09:55:05

智慧轨迹

发布在

科普

阅读：528

标题：顶级AI认知能力不及老年人，大模型集体“翻车”

随着AI技术的发展，人们常猜测AI是否会取代人类医生。最近，《英国医学杂志》上的一项研究揭示了一个惊人的发现：AI表现出类似人类轻度认知障碍的症状。

该研究由以色列哈达萨医疗中心团队主导，评估了五种大语言模型的认知能力，包括OpenAI的ChatGPT 4和ChatGPT-4o+、谷歌的Gemini 1.0和1.5，以及Anthropic的Claude 3.5 Sonnet等。结果显示，ChatGPT 4o表现最好，但也仅达到26分的及格线，其余模型分数更低。有趣的是，早期版本的模型表现更差。

评估中，AI在命名、注意力、语言和抽象思维等任务中表现良好，但在视觉空间和执行功能测试中表现欠佳。例如，在连线测试和时钟绘制测试中，AI表现不佳，错误模式与认知障碍患者相似。Gemini模型在记忆测试中也出现“健忘”现象，未能记住先前的五个词。

研究还发现，AI模型处理视觉空间问题的能力有限，对Navon图形和偷饼干图片测试中的复杂场景理解不足。尽管如此，AI在文本分析和抽象推理任务中表现优秀。

这项研究提醒我们，AI在医学领域应用时需谨慎。AI的某些根本性限制可能持续存在，特别是在视觉抽象能力和执行功能方面。未来研究应关注提升AI的共情和情境理解能力，以实现人类智慧与AI优势互补的新格局。

原文链接

本文链接：https://kx.umi6.com/article/11559.html

转载请注明文章出处

AI认知能力