偏好对齐 - AI优秘圈

综合

7*24 快讯

AI科普

合作

全部

英雄令

项目方

开发者

产品方

投资者

无需人类或GPT-4打标签！南大&旷视研究院无监督范式大幅降低视觉大模型对齐成本

南京大学和旷视研究院联手推出了一种革新性的无监督范式，无需人工标注或GPT-4参与，显著降低了视觉大模型的对齐成本。他们针对视觉语言模型（VLM）的偏好对齐问题，研发了Self-Supervised Visual Preference Alignment（SeVa）方法。SeVa通过自动化构建正负样本，解决了模型在理解和用户体验上的不足，如对指令的遵循、幻觉回答减少等。研究团队利用LLaVa-1.5模型进行实验，结果显示，仅用少量无监督数据就能提升模型性能，且整个过程成本低、效率高。SeVa不仅提高了模型的指令理解能力，还增强了回答的一致性和鲁棒性，使其输出更符合人类偏好。这项成果已在GitHub开源，为视觉模型的优化提供了新的可能性。

原文链接