1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头

在AIGC技术快速发展的今天,AI生成内容的逼真度越来越高,但也带来了虚假新闻、身份欺诈等安全隐患。AI生成图像检测因此成为一项基础安全能力。然而,检测器在公开基准数据集上表现优异,却在面对全新模型或数据分布时性能大幅下降。

近日,腾讯优图实验室联合华东理工大学、北京大学等团队提出了一种名为“双重数据对齐”(Dual Data Alignment, DDA)的方法,从数据层面解决这一问题。该方法通过抑制训练数据中的“偏差特征”,显著提升了检测器在跨模型、跨数据域场景下的泛化能力。相关论文已被NeurIPS 2025接收为Spotlight。

研究发现,AI图像检测器的失效根源在于训练数据本身的构造方式。真实图像来源复杂,画质参差不齐,多以JPEG格式存储;而AI生成图像分辨率固定,常以PNG格式保存,画面干净无压缩痕迹。这种系统性差异让检测器学会了“投机策略”,例如将PNG误判为假图,JPEG误判为真图。一旦对AI生成图像进行简单JPEG压缩,检测器性能便急剧下降。

针对这一问题,DDA方法通过三步操作消除偏差:
1. 像素域对齐:使用VAE技术重建真实图像,统一分辨率和内容,消除像素级偏差。
2. 频率域对齐:对重建图像执行与真实图像相同的JPEG压缩,使两者在高频信息上对齐。
3. Mixup混合:将真实图像与对齐后的生成图像在像素层面混合,进一步增强数据一致性。

实验表明,DDA方法在严格的跨域评测中表现出色:在一个包含11个Benchmark的测试中,DDA在10个数据集上领先;在衡量最差表现的min-ACC指标上,比第二名高出27.5个百分点;在高难度的真实场景数据集Chameleon上,准确率达到82.4%;此外,该方法还能泛化至GAN和自回归模型等不同生成架构。

研究强调,AIGC检测模型的泛化性问题并非源于复杂的模型设计,而是需要从数据源头消除偏差。“双重数据对齐”提供了一种新思路,通过高质量数据迫使模型学习真正重要的特征,从而提升泛化能力。

论文地址:https://arxiv.org/pdf/2505.14359
GitHub:https://github.com/roy-ch/Dual-Data-Alignment

原文链接
本文链接:https://kx.umi6.com/article/29398.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
看到大学生被AI检测折磨,我有话想说
2025-05-10 15:07:39
这届毕业生,快被AI检测逼疯了
2025-06-23 15:27:03
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
AI 顶尖科学家、前 OpenAI 联创 Ilya Sutskever 的 18 个最新思考
2025-11-27 11:29:14
AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头
2025-11-30 14:12:14
AI照妖镜一眼判真假:网页图像视频都能鉴,边播边识别,清华独角兽成果
2024-06-22 18:38:35
「瑞莱智慧」内测首个AIGC实时检测产品RealBelieve|最前线
2024-06-21 13:51:15
AI搞定所有家务?换个房子也能行
2025-04-23 17:02:37
全球算力产业,正在陪着OpenAI走钢丝
2026-01-22 13:55:20
阿联酋人工智能公司G42:未来几年内将数据中心总容量提升至5吉瓦
2026-01-21 17:23:33
大学开始用AI招生了
2026-01-22 15:58:41
成都国资开年「闪击战」背后的产业野望
2026-01-21 20:24:37
马斯克下场抢人!xAI组建「人才狙击队」,极客版HR年薪168万
2026-01-22 12:51:47
24小时热文
更多
扫一扫体验小程序