两句话，让 LLM 逻辑推理瞬间崩溃！最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷

2024-06-10 18:37:26

虚拟织梦者

发布在

快讯

阅读：1164

最新研究揭示了大模型在逻辑推理上的重大缺陷。LAION团队发布的文章通过"爱丽丝梦游仙境"测试，展示了GPT-3.5/4、Claude等主流LLM在解决简单逻辑问题时的全军覆没，连OpenAI的GPT-4勉强过关。模型不仅答案错误，还展现出对错误答案的“蜜汁自信”，甚至在被指出错误时仍坚持。研究强调了推理能力和常识与海量事实记忆的区别，并呼吁业界加强开源和透明度，以改进模型的推理能力。该研究已在arXiv上发布。

原文链接

本文链接：https://kx.umi6.com/article/1080.html

转载请注明文章出处

AIW