1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

正文:
多模态模型在感知与生成方面表现优异,但常因信息缺失或语义复杂而产生“幻觉”,即输出与事实不符的内容。这种问题源于训练中对简单样本的过度依赖,导致模型在复杂场景中的可靠性受限。

上海科技大学何旭明教授团队提出了一种名为 DA-DPO 的框架,通过预训练模型估计样本难度,并动态调整训练权重,使模型更关注困难样本,从而缓解简单样本主导训练的偏差。该方法无需额外人工标注或复杂强化学习流程,成本低且效率高。实验表明,DA-DPO 不仅显著降低了幻觉发生率,还保持甚至提升了模型的整体能力。

研究团队在多个评测基准(如 AMBER、MMHalBench 等)上验证了 DA-DPO 的效果。结果显示,该方法在减少幻觉的同时,在复杂视觉推理和多轮对话等任务中表现稳健。进一步分析发现,DA-DPO 通过缩小简单与困难样本之间的奖励差距,有效抑制了细粒度幻觉。

为验证方法的普适性,团队采用多种模型(如 LLaVA v1.5)和数据集(如 BPO 和 VLFeedback),并设计了一种无需额外训练的难度估计机制。通过融合对比式和生成式模型的评分,团队实现了稳定且鲁棒的难度评估。此外,消融实验表明,联合使用两类模型的效果优于单一来源,而软加权方式比直接过滤简单样本更具优势。

这项研究揭示了传统偏好优化方法的难点偏置问题,并提出以样本难度为核心优化目标的新视角。DA-DPO 不仅适合工业级部署,还能提升模型在医疗影像、自动驾驶等高风险领域的可靠性。未来,团队计划探索领域自适应的难度估计方法,以应对目标领域与预训练语料差异较大的情况。

论文地址:https://arxiv.org/pdf/2601.00623v1

原文链接
本文链接:https://kx.umi6.com/article/31743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI科学家能不能理解普通人对AI的需求,怎么理解?
2024-10-09 10:59:30
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
阶跃生态开放日:聚焦智能终端 Agent,率先布局端侧全产业
2025-02-25 17:06:04
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
2025-07-09 14:06:26
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
2024-11-11 16:27:28
多模态都是假的:最强模型数不清手指、认不出雷碧
2025-07-22 15:38:55
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
阿里深夜炸场!通义千问发布新一代端到端旗舰模型Qwen2.5-Omni
2025-03-27 04:26:09
全新创作平台SkyReels来了!一张画布+对话框包办AI视频创作流程
2025-11-04 13:13:09
Nano Banana Pro 新对手,智谱联合华为开源首个国产芯片训练的多模态 SOTA 模型 GLM-Image
2026-01-14 10:24:53
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
天工大模型 4.0 o1 版 / 4o 版上线,App 及网页可免费使用
2025-01-06 11:23:41
独家|华为昇腾适配阶跃星辰多模态开源模型
2025-03-10 14:41:01
24小时热文
更多
扫一扫体验小程序