1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

正文:
多模态模型在感知与生成方面表现优异,但常因信息缺失或语义复杂而产生“幻觉”,即输出与事实不符的内容。这种问题源于训练中对简单样本的过度依赖,导致模型在复杂场景中的可靠性受限。

上海科技大学何旭明教授团队提出了一种名为 DA-DPO 的框架,通过预训练模型估计样本难度,并动态调整训练权重,使模型更关注困难样本,从而缓解简单样本主导训练的偏差。该方法无需额外人工标注或复杂强化学习流程,成本低且效率高。实验表明,DA-DPO 不仅显著降低了幻觉发生率,还保持甚至提升了模型的整体能力。

研究团队在多个评测基准(如 AMBER、MMHalBench 等)上验证了 DA-DPO 的效果。结果显示,该方法在减少幻觉的同时,在复杂视觉推理和多轮对话等任务中表现稳健。进一步分析发现,DA-DPO 通过缩小简单与困难样本之间的奖励差距,有效抑制了细粒度幻觉。

为验证方法的普适性,团队采用多种模型(如 LLaVA v1.5)和数据集(如 BPO 和 VLFeedback),并设计了一种无需额外训练的难度估计机制。通过融合对比式和生成式模型的评分,团队实现了稳定且鲁棒的难度评估。此外,消融实验表明,联合使用两类模型的效果优于单一来源,而软加权方式比直接过滤简单样本更具优势。

这项研究揭示了传统偏好优化方法的难点偏置问题,并提出以样本难度为核心优化目标的新视角。DA-DPO 不仅适合工业级部署,还能提升模型在医疗影像、自动驾驶等高风险领域的可靠性。未来,团队计划探索领域自适应的难度估计方法,以应对目标领域与预训练语料差异较大的情况。

论文地址:https://arxiv.org/pdf/2601.00623v1

原文链接
本文链接:https://kx.umi6.com/article/31743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Nano Banana Pro 新对手,智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image
2026-01-14 10:24:53
阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强
2025-03-25 09:46:01
全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
2025-02-08 14:22:14
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型 已上架超4万个开源模型
2025-02-21 13:58:38
行业首个:商汤发布并开源 NEO 原生多模态模型架构,实现视觉、语言深层统一
2025-12-02 23:39:14
阶跃星辰首届开放日:多模领先,智能终端等Agent应用全面涌现
2025-02-21 18:55:11
3D打印火出圈了?一众网友秀“成果” 幕后推手竟是这款AI模型
2025-09-01 13:19:49
阿里云栖大会一口气发布千问 3-VL、万相 2.5 等六大模型 + 通义百聆新品牌,覆盖文本、视觉、语音、视频、代码、图像全场景
2025-09-24 14:42:04
全球最大开源视频模型,现在也Created in China了,阶跃出品
2025-02-18 13:15:12
谷歌 AI 搜索引擎被指严重“幻觉”,错误称印度空难失事波音客机为“空中客车”机型
2025-06-13 11:06:41
阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni
2025-03-27 04:26:09
独家|华为昇腾适配阶跃星辰多模态开源模型
2025-03-10 14:41:01
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
24小时热文
更多
扫一扫体验小程序