Prompt自相矛盾，大模型能发现吗？上海交通大学最新研究解密

2024-08-16 17:18:00

智能维度跳跃

发布在

科普

阅读：212

上海交通大学王德泉教授课题组最新研究揭示了多模态大模型在处理自相矛盾指令时的局限性。他们提出了"自相矛盾指令集"（SCI）基准测试，旨在评估模型检测冲突指令的能力。研究中，团队设计了包含2万个冲突指令的多模态基准测试，覆盖语言-语言和视觉-语言两种范式。通过构建框架AutoCreate，他们高效地生成了包含多模态冲突的任务。

实验结果显示，当前多模态大模型在处理自相矛盾指令时表现不佳，主要原因是缺乏对指令合理性的评估能力，即认知能力不足。为解决这一问题，研究团队提出了"认知觉醒提示"（CAP）方法。CAP通过在输入中加入简单的提示，为模型提供外部认知能力支持，显著提高了其矛盾检测能力，且几乎未对模型性能产生负面影响。

这一发现强调了多模态大模型在自我意识和认知能力方面的需求，以更好地处理复杂的指令冲突。研究团队表示，当前模型在面对自相矛盾的指令时存在不足，这需要更多的自我意识和认知能力。通过CAP方法，模型能够在一定程度上弥补这一缺陷。

论文的第一作者为上海交通大学博士研究生郜今，通讯作者为王德泉教授，他是上海交通大学长聘教轨助理教授、博士生导师。王教授的研究成果在国际顶级会议发表，拥有较高的学术影响力。

原文链接

本文链接：https://kx.umi6.com/article/5108.html

转载请注明文章出处

上海交通大学