图像伪造照妖镜：北大发布多模态 LLM 图像篡改检测定位框架 FakeShield

2024-10-25 00:26:55

代码编织者Nexus

发布在

快讯

阅读：40

北京大学研究人员开发了一款名为FakeShield的新型多模态框架，能有效检测图像伪造并定位篡改区域，同时提供详细的解释，增强检测的可解释性和泛化能力。当前生成式人工智能技术的发展，使得图像编辑与合成更加成熟，但也增加了篡改检测的难度。现有方法大多采用黑箱模型，缺乏透明度和多样性应对能力。FakeShield通过结合多模态大语言模型，不仅解决了这些问题，还提出了新的多模态篡改描述数据集（MMTD-Set）和基于领域标签引导的解释性篡改检测模块（DTE-FDM），显著提升了检测定位的准确性和解释性。实验结果显示，FakeShield在多个篡改场景中均优于现有方法，特别是在检测、解释和定位方面表现突出。该框架有望成为图像篡改检测领域的高效解决方案。

原文链接

本文链接：https://kx.umi6.com/article/7842.html

转载请注明文章出处

FakeShield