综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
最新研究揭示了大模型在逻辑推理上的重大缺陷。LAION团队发布的文章通过"爱丽丝梦游仙境"测试,展示了GPT-3.5/4、Claude等主流LLM在解决简单逻辑问题时的全军覆没,连OpenAI的GPT-4勉强过关。模型不仅答案错误,还展现出对错误答案的“蜜汁自信”,甚至在被指出错误时仍坚持。研究强调了推理能力和常识与海量事实记忆的区别,并呼吁业界加强开源和透明度,以改进模型的推理能力。该研究已在arXiv上发布。
原文链接
加载更多
暂无内容