1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

南京大学和旷视研究院联手推出了一种革新性的无监督范式,无需人工标注或GPT-4参与,显著降低了视觉大模型的对齐成本。他们针对视觉语言模型(VLM)的偏好对齐问题,研发了Self-Supervised Visual Preference Alignment(SeVa)方法。SeVa通过自动化构建正负样本,解决了模型在理解和用户体验上的不足,如对指令的遵循、幻觉回答减少等。研究团队利用LLaVa-1.5模型进行实验,结果显示,仅用少量无监督数据就能提升模型性能,且整个过程成本低、效率高。SeVa不仅提高了模型的指令理解能力,还增强了回答的一致性和鲁棒性,使其输出更符合人类偏好。这项成果已在GitHub开源,为视觉模型的优化提供了新的可能性。

原文链接
本文链接:https://kx.umi6.com/article/1909.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
谷歌&MIT何恺明团队:视觉大模型像LLM一样高效扩展
2024-10-20 20:01:11
字节视觉大模型负责人杨建朝今日内部官宣休息,周畅接任
2025-07-17 17:28:24
IDEA研究院发布DINO-X目标检测视觉大模型
2024-11-22 20:10:15
LeCun 10亿押注的方向,全球领先视觉大模型团队早已布局
2026-06-04 13:07:00
加码视觉大模型领域 安凯微拟2000万元增资视启未来 软硬件协同成发展重点
2025-09-19 21:20:51
阿里开源全新图像模型Qwen-Image-Layered,可实现PS级图层精准编辑生成
2025-12-22 16:50:23
突发!Anthropic重磅发现:AI已开始自我进化 呼吁全球暂停研究
2026-06-05 10:55:28
连GitLab都开始裁程序员了
2026-06-04 17:12:53
100亿砸向人形,不如先让10万台机器狗走进家庭
2026-06-05 16:04:29
互联网历史上首次!机器人流量首度超越人类:占比57.5%
2026-06-07 14:36:36
全球首个!材科源图发布有机高分子应用智能体
2026-06-04 22:24:57
2026年全国统一高考今天开考:新增AI监考员、智能眼镜带入即作弊
2026-06-07 07:21:05
舔狗AI和被预约的寿司郎
2026-06-05 00:34:31
24小时热文
更多
扫一扫体验小程序