1
免责声明:Al优秘圈所有资讯仅代表作者个人观点,不构成任何投资理财建议。请确保访问网址为(kx.umi6.com) 投诉及建议

AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头

在AIGC技术快速发展的今天,AI生成内容的逼真度越来越高,但也带来了虚假新闻、身份欺诈等安全隐患。AI生成图像检测因此成为一项基础安全能力。然而,检测器在公开基准数据集上表现优异,却在面对全新模型或数据分布时性能大幅下降。

近日,腾讯优图实验室联合华东理工大学、北京大学等团队提出了一种名为“双重数据对齐”(Dual Data Alignment, DDA)的方法,从数据层面解决这一问题。该方法通过抑制训练数据中的“偏差特征”,显著提升了检测器在跨模型、跨数据域场景下的泛化能力。相关论文已被NeurIPS 2025接收为Spotlight。

研究发现,AI图像检测器的失效根源在于训练数据本身的构造方式。真实图像来源复杂,画质参差不齐,多以JPEG格式存储;而AI生成图像分辨率固定,常以PNG格式保存,画面干净无压缩痕迹。这种系统性差异让检测器学会了“投机策略”,例如将PNG误判为假图,JPEG误判为真图。一旦对AI生成图像进行简单JPEG压缩,检测器性能便急剧下降。

针对这一问题,DDA方法通过三步操作消除偏差:
1. 像素域对齐:使用VAE技术重建真实图像,统一分辨率和内容,消除像素级偏差。
2. 频率域对齐:对重建图像执行与真实图像相同的JPEG压缩,使两者在高频信息上对齐。
3. Mixup混合:将真实图像与对齐后的生成图像在像素层面混合,进一步增强数据一致性。

实验表明,DDA方法在严格的跨域评测中表现出色:在一个包含11个Benchmark的测试中,DDA在10个数据集上领先;在衡量最差表现的min-ACC指标上,比第二名高出27.5个百分点;在高难度的真实场景数据集Chameleon上,准确率达到82.4%;此外,该方法还能泛化至GAN和自回归模型等不同生成架构。

研究强调,AIGC检测模型的泛化性问题并非源于复杂的模型设计,而是需要从数据源头消除偏差。“双重数据对齐”提供了一种新思路,通过高质量数据迫使模型学习真正重要的特征,从而提升泛化能力。

论文地址:https://arxiv.org/pdf/2505.14359
GitHub:https://github.com/roy-ch/Dual-Data-Alignment

原文链接
本文链接:https://kx.umi6.com/article/29398.html
转载请注明文章出处
分享至
打开微信扫一扫
内容投诉
生成图片
相关推荐
换一换
AI 顶尖科学家、前 OpenAI 联创 Ilya Sutskever 的 18 个最新思考
2025-11-27 11:29:14
这届毕业生,快被AI检测逼疯了
2025-06-23 15:27:03
看到大学生被AI检测折磨,我有话想说
2025-05-10 15:07:39
AI照妖镜一眼判真假:网页图像视频都能鉴,边播边识别,清华独角兽成果
2024-06-22 18:38:35
Ilya罕见发声:大模型「大力出奇迹」到头了
2025-11-26 09:32:32
AI搞定所有家务?换个房子也能行
2025-04-23 17:02:37
「瑞莱智慧」内测首个AIGC实时检测产品RealBelieve|最前线
2024-06-21 13:51:15
AIGC检测为何频频“看走眼”?腾讯优图揭秘:问题可能出在数据源头
2025-11-30 14:12:14
腾讯自研 AI 大模型混元 2.0 发布:总参数 406B,复杂推理场景综合表现“稳居国内第一梯队”
2025-12-05 22:54:39
西北首台量子计算机落地西安
2025-12-07 08:18:21
国产GPU第一股诞生!摩尔线程正式登陆科创板
2025-12-05 11:26:22
著名教授Ken Ono加入AI初创公司Axiom,担任创始数学家
2025-12-05 16:38:52
“豆包手机”在二手市场价格都翻倍了……
2025-12-05 15:34:04
24小时热文
更多
扫一扫体验小程序