Skip to main content
guideai-detectionimages

AI生成图像检测器:它检查什么、局限在哪里,以及如何使用

· 8 min read· NotGPT Team

AI生成图像检测器是一种工具,它将图像作为输入,并估算软件生成该图像的概率,而不是相机捕捉光线。该技术随着它追踪的生成器Midjourney、DALL-E、Stable Diffusion和Flux而迅速成熟——这些生成器现在可以生成通过随意检查而不显示明显特征的图像,这促使检测方法更深入地寻找——超越表面外观,进入图像文件本身的统计结构。理解AI生成图像检测器实际在测量什么——以及该测量在哪里失效——有助于任何使用这些工具的人对评分的权重做出更好的判断。本指南涵盖检测器使用的信号、暴露AI图像的伪影、为什么假阳性比大多数工具营销承认的更频繁,以及创作者和编辑在发布或提交图像前验证图像的实用检查清单。

AI生成图像检测器实际上在寻找什么?

AI生成图像检测器的评估方式与人不同。它不评估主体看起来是否自然,或照明是否看起来合理。相反,它将图像转换为数据,并搜索统计特征,这些特征区分生成式AI系统如何生成像素值与物理相机传感器如何记录光线。三个信号类别支撑了大多数当前方法:频域分析、视觉伪影分类和元数据检查。频域分析在技术上是三者中最稳健的。AI图像生成器——无论是Stable Diffusion这样的扩散模型还是DALL-E这样的基于transformer的系统——都通过从噪声开始的迭代细化来构建图像。该过程在结果文件的高频分量中引入图案,这些图案与真实相机传感器的噪声分布有明显不同。使用傅立叶变换将图像转换为其频率表示,即使图像看起来对人类观看者是照相逼真的,也能揭示这些图案,它们往往能在中等JPEG压缩后存活,这使得该信号在已调整大小或通过社交媒体平台的图像中很有用。视觉伪影分类的工作方式不同:它不分析频率结构,而是在已知AI生成错误的示例上训练神经分类器,并学会在像素级识别那些错误模式。元数据检查是最快的检查——它查看文件是否带有真实照片会有的EXIF数据,或者如AI生成文件通常那样到达时没有该信息。这三个信号最有用的是组合使用,因为任何单个信号都可能单独产生误导性结果。

哪些视觉伪影暴露AI图像?

AI生成器产生的伪影图案足够可预测,以至于经验丰富的图像审查员可以在运行任何检测工具之前手动识别它们。知道要寻找什么会加速任何验证工作流程的人工部分,并为落在不确定中间范围内的检测器评分增加有意义的背景。手和手指是AI生成图像中最常引用的失败点,即使在最近的生成器版本中,它们仍然是一个可靠的迹象。AI系统构建手指时没有基础解剖学模型——它们合成手的预期视觉图案,而不强制执行一致的关节数、手指长度或连接几何。结果包括多余的手指、合并的指关节、溶解到手掌中的手指,以及以错误角度分解的指甲。检查肖像中的手是一个10秒的手动测试,可以捕捉有意义比例的合成图像。眼睛和虹膜纹理显示相关图案。真实虹膜有独特的、不对称的纤维图案;AI生成器往往在两只眼睛之间产生双边对称,因此相同的纹理在每个虹膜中出现镜像。在正面肖像中这是一个快速检查;在只有一只眼睛完全可见的横侧镜头中,它不那么有用。背景文字——标志、标签、书脊、在镜子或屏幕中可见的文字——在AI生成的图像中几乎总是分解成乱码或近似乱码。生成器理解文本应该在上下文中出现,而没有对字符应该说什么的模型。检查任何可见文本的可读性只需几秒钟,并可靠地捕捉这个伪影。反射和阴影是另一个值得检查的位置。AI系统不能持续建模物理光学:眼镜中的反射可能显示主场景中不存在的光源;阴影可能以不一致的方向下降;水面可能反映与框架上方的天空不匹配的天色。框架边缘的头发是一个更微妙的迹象。真实头发股对着背景有明确的边缘;AI生成器通常产生头发,以不自然的光滑梯度融入或从背景中出现,特别是在肖像的顶部和侧面。

"最难捕捉的AI图像不是最逼真的——而是某人事后通过真实相机噪声管道运行过图像的那些,混合合成内容和真实传感器特性。" — 计算机视觉研究员,2025

元数据作为检测信号的可靠性如何?

元数据检查是任何AI图像检测工作流程中最快的检查,它产生明确的结果:文件要么携带与相机捕捉一致的EXIF数据,要么不携带。限制是缺少或不完整的EXIF有几个合法的解释与AI生成无关。截图不携带EXIF数据。从社交媒体平台下载的图像——Instagram、Twitter/X、WhatsApp——在平台的上传和处理过程中通常被剥离元数据。通过主要库提供的库存摄影经常在销售时不包含位置或设备数据以保护隐私和许可。从网站爬取的图像可能在沿途的任何转换和压缩步骤中丢失了其EXIF。仅缺少EXIF记录因此是一个弱信号。它提高了合成起源的概率,但其缺失在真实照片中确实很常见,特别是在大多数图像验证发生的社交媒体环境中。元数据检查的更可操作的版本寻找不一致而非缺失:显示修改时间戳比声称捕捉日期更近的EXIF,或与图像内容矛盾的相机型号元数据,是比没有元数据更强的标志。新兴的标准正在逐步解决元数据差距。内容出处和真实性联盟(C2PA)开发了一个出处标准,将元数据加密地绑定到文件,使篡改可检测。Adobe的Content Credentials系统实现了C2PA,在摄影师和设计师的某些导出工作流程中可用。Google的SynthID在由Imagen和某些其他Google AI工具生成的图像中嵌入了一个不可见的水印——一个在中等编辑和压缩后存活并可以通过相应检测系统验证的水印。基于水印的方法的实际限制是覆盖面:它们只识别来自已采用该系统的生成器的图像,目前不包括Midjourney、Stable Diffusion、Flux和大多数广泛使用的第三方工具。元数据检查仍然是有用的第一步,但只是多个输入之一。

AI生成图像检测器可能错误标记真实照片吗?

假阳性是当前可用的每个AI生成图像检测器的记录限制,它们以比大多数商业工具营销承认的更高的速率发生。假阳性是当检测器为真实用相机拍摄的图像返回高AI概率评分时发生。几类真实摄影持续产生这些结果。重度修饰是最常见的原因。用于商业用途的肖像摄影——广告活动、专业头像、产品样本——通常经历广泛的后期处理:频率分离皮肤平滑、背景替换和色调映射。这些编辑以类似于AI生成器产生的方式改变图像的频域特征。经过大量修饰的商业头像可以在某些检测器上触发80%或更高的AI概率评分,而不涉及任何AI参与其创建。HDR和色调映射摄影呈现类似问题。高动态范围处理以某些检测器读作合成信号的方式压缩高光和阴影细节之间的关系。库存摄影是特别高风险的类别,因为它结合了重度修饰、EXIF剥离和格式转换——三个特征分别提高检测怀疑,并在几乎每个商业库存图像中一起出现。通过模拟风格过滤器的照片——胶片颗粒叠加、暗角或作为纹理层应用的色彩分级——也可能产生假阳性,因为添加随机高频噪声会中断检测器使用的频域信号。人口统计学因素也很重要。主要在来自某些生成器风格的合成图像上训练的检测模型在检测模型训练数据中代表不足的特征的个人的摄影中可能表现不太准确。这是影响多个商业工具的AI图像分析中记录的偏见类别。对任何检测器评分的正确态度是概率性的:高结果意味着进一步调查并仔细查看图像本身,而不是AI起源是确定的。

压缩或编辑后检测精度会发生什么?

当图像通过编辑和分布管道时,检测器使用的信号会降级。这很重要,因为在真实验证环境中遇到的大多数图像不是来自生成器的原始文件——它们已被下载、调整大小、共享、截图、裁剪、过滤,并通过多个平台重新上传。每个步骤以减少检测信心的方式改变图像数据。JPEG压缩是最常见的降级因素。JPEG编码选择性地丢弃高频细节,并且区分AI生成图像和照片的频域信号的重要部分存在于这些高频波段。AI生成的图像压缩为低JPEG质量设置——当图像上传到WhatsApp、Instagram或Twitter/X时自动发生——会失去其原本携带的合成信号的可测量部分。经过两到三轮这种操作后,图像的频率特征可能变得与大量压缩的真实照片的特征无法区分。故意的后期处理也可能降低可检测性。通过胶片颗粒叠加、噪声层或模拟过滤器应用运行AI生成的图像会添加随机高频内容,该内容掩盖了检测器的主要信号。这种方法在安全研究文献中被引用为降低图像上检测评分的方法,否则这些评分评分会很高。对编辑和记者的实际含义是,对经过大量处理的图像的低AI概率评分比对原始文件的低评分的意义更小。如果您无法在任何社交媒体上传之前获得图像的原始版本,则应谨慎解释低检测评分。对于以压缩形式接收的图像,将检测器结果与手动伪影检查和元数据检查结合起来比任何单个评分产生更可靠的整体评估。

"检测器评分在您有原始文件时最有意义。经过四个压缩周期后,您主要是在分析压缩算法的输出,而不是图像的起源。" — 数字取证研究员,2024

实用检查清单:在共享前运行AI生成图像检查

对于想要在发布前验证图像的创作者,以及审查他人提交的视觉内容的编辑,最可靠的方法是将检测器运行与需要少于五分钟总时间的几个手动检查相结合。以下步骤按速度顺序运行,最快的在前。目标不是法医确定性——而是积累足够的证据做出知情决定并记录您的方式。

  1. 获得图像的最高质量版本。来自相机或生成器的原始文件携带比压缩副本更多的信号。如果您从另一个人那里收到图像,请要求原始导出而不是截图或重新上传。
  2. 在运行检测器之前检查EXIF元数据。使用免费EXIF查看器并记录相机制造商和型号是否存在、时间戳是否与声称的背景一致,以及任何元数据字段是否具有比原始捕捉日期更近的修改时间戳。
  3. 使用Google图片和TinEye运行反向图像搜索。如果图像在其他地方出现并归因于不同来源或不同的声称日期,该背景差异通常比检测器评分更快地发现,并作为证据更有可操作性。
  4. 将原始图像上传到AI生成图像检测器并在背景中阅读信心评分。85%以上的评分值得深入审查;40–70%范围内的评分是真正不确定的,不应被视为明确的标志或清洁票据。
  5. 手动检查五个最高错误区域:手和手指、眼睛和虹膜纹理、背景文本和标志、框架边界处的头发或织物边缘,以及眼镜、水或其他表面中的反射。
  6. 如果图像经过社交媒体压缩或编辑,则降低对检测器评分的信心,并更多地权衡您的手动检查。压缩图像在任一方向都更难以可靠地分类。
  7. 对于高风险决定——学术诚信确定、新闻出版、法律或人力资源背景——通过第二个独立检测器运行相同图像并比较结果。不同工具之间的一致标记强化了确定;分歧表明真正的不确定性并值得披露。
  8. 记录您的过程。记录您使用了哪些工具、它们返回了什么评分,以及您的手动检查发现了什么。书面记录比单个未解释的结论更容易防御,特别是如果确定具有个人或专业后果。

NotGPT如何处理AI图像检测

NotGPT的AI图像检测功能内置在移动应用中:从您的相册上传图像或用您的设备相机捕捉一张,应用返回一个概率评分,指示图像是否可能由AI生成。检测涵盖来自包括Midjourney、DALL-E和Stable Diffusion在内的主要生成器的图像。对于其工作流程还包括文本验证的用户——审查学生提交、求职信或营销副本——两种检查都在同一应用中可用,无需在工具之间切换。对于想要在同一会话中记录检测评分和自己的手动观察的创作者和编辑,拥有图像检测和文本检测在一起简化了该记录保存。结果包括概率评分而不是二进制判决,这与这些工具应该如何使用相一致:作为更广泛评估中的一个输入,而不是自动最终决定。

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。