AIW - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

两句话，让 LLM 逻辑推理瞬间崩溃！最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷

最新研究揭示了大模型在逻辑推理上的重大缺陷。LAION团队发布的文章通过"爱丽丝梦游仙境"测试，展示了GPT-3.5/4、Claude等主流LLM在解决简单逻辑问题时的全军覆没，连OpenAI的GPT-4勉强过关。模型不仅答案错误，还展现出对错误答案的“蜜汁自信”，甚至在被指出错误时仍坚持。研究强调了推理能力和常识与海量事实记忆的区别，并呼吁业界加强开源和透明度，以改进模型的推理能力。该研究已在arXiv上发布。

原文链接