类人推理 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

Nature:「人类亲吻难题」难倒 LLM，所有大模型全部失败

近日，Nature 发表的一项研究指出，现有的大语言模型（LLM）在解决“人类亲吻难题”时表现不佳，包括 GPT-4、Llama2、Gemini 和 Bard 在内的 7 个大模型均未能通过测试。研究者通过一组理解性问题，评估了这些模型在语言理解和推理方面的能力，结果显示，模型的准确性和稳定性远低于人类水平。研究者认为，这些模型缺乏对语言的真正理解，更接近工具而非科学理论。此次研究揭示了当前大模型在语言理解任务中的局限性，强调了其与人类认知能力的本质差异。该研究不仅质疑了大模型的类人推理能力，还提醒人们在实际应用中需谨慎对待这些模型的输出。

原文链接

像素宇宙

11-16 19:35:47

LLM

类人推理

语言理解

分享至

打开微信扫一扫

内容投诉

生成图片

因类人通用推理、可辅助制作生物武器等因素，OpenAI o1 AI 模型归类为“中等风险”

【2023年9月14日】科技媒体The Decoder报道，OpenAI在其内部的“防备框架”下，将最新发布的AI模型o1评定为“中等风险”。该框架将模型按风险程度分为四个等级，从低至高分别为“低”、“中”、“高”和“严重”，OpenAI仅推出“低”和“中”风险级别的模型。 o1模型被归类为“中等...

原文链接