1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

自从ChatGPT问世以来,大语言模型不断刷新人们对人工智能的认知,甚至“通用人工智能即将到来”也成了陈词滥调。然而,学界内部对大语言模型的质疑声渐增,尤其是在“可解释的人工智能”方面的研究遭遇瓶颈。最近,苹果公司的研究报告指出大语言模型并不具备逻辑推理能力,引发了广泛讨论。

苹果的研究评估了大语言模型在数学推理方面的能力,通过修改数学应用题中的专有名词、数字和添加无关信息,发现模型的正确率显著下降。这表明大语言模型并不真正理解数学概念或进行逻辑推理,只是依赖记忆和匹配。

去年,我曾指出ChatGPT不具备逻辑推理能力,因为它依赖于大量训练数据的记忆,而非真正的推理能力。苹果公司的研究支持了这一观点。但反对者认为,大语言模型已经展示了超越人类的推理能力,不应仅凭某些错误结论否定其推理能力。

正反双方主要通过列举成功或失败的案例来支持各自的立场,这虽然具体可验证,但难以全面揭示系统的一般推理能力。此外,如何衡量现有缺陷的可改进性也是一个问题。

“推理”通常指从已知前提推导出新结论的过程,但在定义“正确性”时存在争议。逻辑学研究推理的规范性,而心理学关注推理的描述性。神经网络模型倾向于描述性理论,依赖人类的实际行为,但缺乏规范性推理的透明度和可靠性。

深度学习中的推理基于描述性理论,通过训练数据来确定模型行为,这导致了难以解释的过程和潜在的偏见。尽管近期出现了“思维链”等改进措施,但其正确性标准仍受限于训练数据。

推理能力的来源涉及先天因素和后天因素。大语言模型可以被视为描述性推理模型,擅长模式匹配而非遵循逻辑。尽管它们在某些场景中表现出色,但不能视为实现了推理功能。大语言模型可以通过训练学习逻辑和数学知识,但这些知识更多是对象层面的知识,而非元知识。

总之,大语言模型非常有用,但不能解决人工智能的基本问题,包括推理。

原文链接
本文链接:https://kx.umi6.com/article/8646.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Agent是“新瓶装旧酒”,氛围编码不值得尝试?
2025-05-08 14:32:22
霍普菲尔德:我如何为物理学打开AI之门
2024-10-15 17:29:36
OpenAI的联合创始人,说未来的计算机长这样
2024-07-06 07:02:53
断交OpenAI后,人形机器人独角兽首秀:一个神经网络控制整个上身,能听懂人话可抓万物
2025-02-21 01:32:03
攻略在手,轻松玩转 DeepSeek
2025-02-08 21:33:12
2024诺贝尔物理学得主:以神经网络为笔,书写AI时代新篇章
2024-10-09 12:04:51
大模型来了,你要裁员吗?
2024-07-12 08:41:18
从蛰伏到王炸,RL启示录
2025-03-25 19:11:14
顺丰发布“丰语”大语言模型:摘要准确率超 95%,号称物流垂域能力超越通用模型
2024-09-10 19:32:12
两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷
2024-06-10 21:37:45
两句话,让 LLM 逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出 GPT、Claude 等重大缺陷
2024-06-10 18:37:26
与AI互动的信息时代黎明:吃掉自尊心才能拓展认知边界
2025-01-11 10:35:01
中国电信发布“复杂推理大模型”TeleAI-t1-preview:能解《九章算术》题目
2025-01-25 19:01:51
24小时热文
更多
扫一扫体验小程序