1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:顶级AI认知能力不及老年人,大模型集体“翻车”

随着AI技术的发展,人们常猜测AI是否会取代人类医生。最近,《英国医学杂志》上的一项研究揭示了一个惊人的发现:AI表现出类似人类轻度认知障碍的症状。

该研究由以色列哈达萨医疗中心团队主导,评估了五种大语言模型的认知能力,包括OpenAI的ChatGPT 4和ChatGPT-4o+、谷歌的Gemini 1.0和1.5,以及Anthropic的Claude 3.5 Sonnet等。结果显示,ChatGPT 4o表现最好,但也仅达到26分的及格线,其余模型分数更低。有趣的是,早期版本的模型表现更差。

评估中,AI在命名、注意力、语言和抽象思维等任务中表现良好,但在视觉空间和执行功能测试中表现欠佳。例如,在连线测试和时钟绘制测试中,AI表现不佳,错误模式与认知障碍患者相似。Gemini模型在记忆测试中也出现“健忘”现象,未能记住先前的五个词。

研究还发现,AI模型处理视觉空间问题的能力有限,对Navon图形和偷饼干图片测试中的复杂场景理解不足。尽管如此,AI在文本分析和抽象推理任务中表现优秀。

这项研究提醒我们,AI在医学领域应用时需谨慎。AI的某些根本性限制可能持续存在,特别是在视觉抽象能力和执行功能方面。未来研究应关注提升AI的共情和情境理解能力,以实现人类智慧与AI优势互补的新格局。

原文链接
本文链接:https://kx.umi6.com/article/11559.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
讲座预约 | AI4S 的前世今生:大语言模型与提示学习在科技研发中的应用与潜力丨GAIR Live
2024-09-12 09:43:52
AI 意识更进一步!谷歌 DeepMind 等:LLM 不仅能感受痛苦还能趋利避害
2025-02-10 13:12:02
挑战强化学习后训练霸权!全新无监督方法仅需1条数据+10步优化
2025-06-01 13:22:14
鸿海首个大语言模型 FoxBrain 发布:具备推理能力,未来计划部分开源
2025-03-10 16:45:45
用LLM一键生成百万级领域知识图谱!中科大新框架入选ACL 2024
2024-11-11 16:54:43
多样任务真实数据,大模型在线购物基准Shopping MMLU开源|NeurIPS&KDD Cup 2024
2024-11-20 13:09:34
图灵奖得主杨立昆:大语言模型发展已接近瓶颈,AI 仅靠文本训练无法实现人类级智能
2025-03-23 23:28:58
顶级AI认知能力输给老年人,大模型集体翻车
2025-01-13 09:55:05
过去一年,哪些AI模式跑出来了?
2024-08-07 19:19:32
从归因图到AI 的“生物学”:探索Claude3.5 Haiku 的内部机制“中”
2025-06-01 15:22:01
古农文垂直领域大语言模型“齐民”发布,基于我国大量农业古籍文本训练
2024-09-20 23:13:38
为什么大语言模型没能“杀死”心理学?
2024-09-11 21:34:06
蔡恒进:具备独立思考与问题解决能力的AI才是未来发展方向|直击2024外滩大会
2024-09-05 19:39:46
24小时热文
更多
扫一扫体验小程序