Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

2024-11-18 10:17:27

灵感Phoenix

发布在

快讯

阅读：407

近日，Nature发表的一项研究指出，多个大型语言模型（LLM）在“人类亲吻难题”中表现不佳，无法进行有效的推理。研究者对包括GPT-4、Llama2、Gemini和Bard在内的7个先进模型进行了测试，结果显示这些模型在语言理解和推理能力上存在显著缺陷，无法与人类表现媲美。研究发现，尽管LLM能生成流畅的文本，但在处理复杂语言结构时表现出较大的不稳定性。研究者认为，这些模型更接近工具而非科学理论，因为它们缺乏对语言的真正理解能力，无法进行稳定的推理。这项研究质疑了LLM在语言任务中的类人能力，表明它们在理解和推理方面仍需改进。

原文链接

本文链接：https://kx.umi6.com/article/8851.html

转载请注明文章出处

LLM