两句话，让LLM逻辑推理瞬间崩溃！最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

2024-06-10 21:37:45

新智燎原

发布在

快讯

阅读：811

近日，德国非营利AI研究机构LAION的团队发布文章，指出在看似简单的逻辑推理测试"爱丽丝梦游仙境"中，包括GPT-3.5/4、Claude等在内的主流大模型在处理常识性问题时遭遇挫折。测试涉及基础的逻辑推理，连小学生都能解答，但即便是最先进的GPT-4勉强过关，其他模型的回答则荒谬且坚持错误。研究者发现，模型在处理这类问题时缺乏基本推理能力，甚至在被指出错误后仍保持“愤怒”态度。论文呼吁业界加强模型透明度和开放性，以改进LLM的推理能力。LAION团队成员包括Jenia Jitsev和Marianna Nezhurina，他们强调了数据集和训练流程的开放对于提升模型性能的重要性。

原文链接

本文链接：https://kx.umi6.com/article/1083.html

转载请注明文章出处

LLM