1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

标题:上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

正文:
多模态模型在感知与生成方面表现优异,但常因信息缺失或语义复杂而产生“幻觉”,即输出与事实不符的内容。这种问题源于训练中对简单样本的过度依赖,导致模型在复杂场景中的可靠性受限。

上海科技大学何旭明教授团队提出了一种名为 DA-DPO 的框架,通过预训练模型估计样本难度,并动态调整训练权重,使模型更关注困难样本,从而缓解简单样本主导训练的偏差。该方法无需额外人工标注或复杂强化学习流程,成本低且效率高。实验表明,DA-DPO 不仅显著降低了幻觉发生率,还保持甚至提升了模型的整体能力。

研究团队在多个评测基准(如 AMBER、MMHalBench 等)上验证了 DA-DPO 的效果。结果显示,该方法在减少幻觉的同时,在复杂视觉推理和多轮对话等任务中表现稳健。进一步分析发现,DA-DPO 通过缩小简单与困难样本之间的奖励差距,有效抑制了细粒度幻觉。

为验证方法的普适性,团队采用多种模型(如 LLaVA v1.5)和数据集(如 BPO 和 VLFeedback),并设计了一种无需额外训练的难度估计机制。通过融合对比式和生成式模型的评分,团队实现了稳定且鲁棒的难度评估。此外,消融实验表明,联合使用两类模型的效果优于单一来源,而软加权方式比直接过滤简单样本更具优势。

这项研究揭示了传统偏好优化方法的难点偏置问题,并提出以样本难度为核心优化目标的新视角。DA-DPO 不仅适合工业级部署,还能提升模型在医疗影像、自动驾驶等高风险领域的可靠性。未来,团队计划探索领域自适应的难度估计方法,以应对目标领域与预训练语料差异较大的情况。

论文地址:https://arxiv.org/pdf/2601.00623v1

原文链接
本文链接:https://kx.umi6.com/article/31743.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
Meta开源多模态模型——Llama 3.2
2024-10-09 11:34:43
DeepSeek 深夜再放大招:7B 参数人人可用的视觉多模态模型 Janus-Pro-7B 开源
2025-01-28 01:38:40
拯救P图废柴,阿里上新多模态模型Qwen-VLo!人人免费可玩
2025-06-28 13:21:34
告别AI“乱画图表”!港中文团队发布首个结构化图像生成编辑系统
2025-10-11 17:30:27
Kimi最新多模态模型K2-VL提前现身
2026-01-05 15:13:56
多模态都是假的:最强模型数不清手指、认不出雷碧
2025-07-22 15:38:55
阶跃星辰推出开源 SOTA 图像编辑模型,一个月连发三款多模态模型
2025-04-27 15:20:13
独家|华为昇腾适配阶跃星辰多模态开源模型
2025-03-10 14:41:01
具身智能实力派!十年多模态打底,世界模型开路,商汤悟能来了
2025-07-28 10:08:25
阿里云魔搭社区:首发阶跃星辰最新开源两款多模态模型 已上架超4万个开源模型
2025-02-21 13:58:38
全球顶级AI科学家许主洪加盟阿里!IEEE Fellow,五万被引论文数,曾任Salesforce集团副总裁
2025-02-08 14:22:14
智谱联合华为开源首个国产芯片训练的多模态SOTA模型
2026-01-14 09:24:34
我被AI骗了
2025-02-27 14:24:34
24小时热文
更多
扫一扫体验小程序