综合
7*24 快讯
AI科普
合作
全部
英雄令
项目方
开发者
产品方
投资者
近日,Nature 发表的一项研究指出,现有的大语言模型(LLM)在解决“人类亲吻难题”时表现不佳,包括 GPT-4、Llama2、Gemini 和 Bard 在内的 7 个大模型均未能通过测试。研究者通过一组理解性问题,评估了这些模型在语言理解和推理方面的能力,结果显示,模型的准确性和稳定性远低于人类水平。研究者认为,这些模型缺乏对语言的真正理解,更接近工具而非科学理论。此次研究揭示了当前大模型在语言理解任务中的局限性,强调了其与人类认知能力的本质差异。该研究不仅质疑了大模型的类人推理能力,还提醒人们在实际应用中需谨慎对待这些模型的输出。
原文链接
【2023年9月14日】科技媒体The Decoder报道,OpenAI在其内部的“防备框架”下,将最新发布的AI模型o1评定为“中等风险”。该框架将模型按风险程度分为四个等级,从低至高分别为“低”、“中”、“高”和“严重”,OpenAI仅推出“低”和“中”风险级别的模型。
o1模型被归类为“中等...
原文链接
加载更多
暂无内容