AI图片检测器:如何识别AI生成的图像
从前一个利基研究工具发展到今天,AI图片检测器已经成为记者、教师、人力资源团队和普通用户经常使用的工具。随着Midjourney、DALL-E和Stable Diffusion的兴起,令人信服的合成图像大规模涌现,用肉眼分辨它们与真实照片已经不再可靠。当有人运行AI图片检测器时,他们通常是在尝试回答一个具体问题:这张图像是由相机拍摄的,还是由软件生成的?本指南将详细解释AI图片检测器的技术工作原理、它能很好地检测什么、在哪些方面存在不足,以及当你真正需要时如何获得准确的结果。
目录
AI图片检测器的实际工作原理
AI图片检测器将图像作为输入并返回概率分数——例如"91%可能是AI生成的"——这个分数是基于从数千张真实和合成训练图像中学到的模式得出的。与反向图像搜索(检查图像是否曾在网上出现过)不同,AI图片检测器分析的是图像本身的像素级结构。它在寻找AI生成器留下的统计指纹:纹理中的细微规律、高频细节的异常,以及光线和阴影在场景中相互作用方式的不一致。输出并不是一个二元的判决。负责任的AI图片检测器会提供一个置信度分数,理想情况下还会突出显示图像中哪些区域对分类的贡献最大。分数为55%的图像确实具有不确定性,应该按此对待;分数为94%的图像则值得进行更高水平的审查。
AI图片检测的技术工作原理
大多数AI图片检测器依赖于以下三种技术中的一种或多种:伪影分析、频域分析和元数据检查。伪影分析是最直观的方法。无论是使用扩散模型还是GAN的AI图像生成器,都是按区域合成图像而不使用全局解剖学模型。这会产生特征性错误:手指相互混合、牙齿在边缘处失去清晰度、虹膜模式以真眼不会出现的方式重复,以及头发在边界处不自然地终止。训练有素的检测器即使在这些模式足以让人类审阅者忽视的细微情况下也能识别它们。频域分析不太明显,但通常更可靠。每个真实的相机传感器都会在其输出中引入特定的噪声图案。当你使用傅里叶变换将图像转换为其频率分量时,AI生成的图像会显示出不同的谱特征——在高频段中出现规则、重复的图案,这在物理光学拍摄的照片中是不会出现的。这个信号能够抵御中等程度的压缩,这使其在处理从社交媒体下载的图像时很有用。元数据检查是最快的检查方法。用智能手机拍摄的真实照片会携带EXIF数据:相机品牌和型号、GPS坐标、时间戳和光圈设置。AI生成的图像通常根本没有EXIF数据,或者携带的元数据是在生成后手动添加的。仅凭这一点还不能得出结论——屏幕截图也会删除EXIF——但与频域分析结合,缺少元数据是一个有意义的信号。
"最难检测的AI图像不是最逼真的那些——而是那些之后通过真实相机管道处理的图像,混合了真实世界的噪声和合成内容。" ——数字法医研究人员,2024
如何使用AI检测器检查图片:逐步指南
当你知道如何操作时,用AI检测器检查图片需要不到一分钟。当你使用原始文件而不是压缩副本时,以及当你将工具的分数与一些手动检查相结合时,结果是最可靠的。
- 获取可用的最高质量版本的图像——下载原始图像而不是对其进行屏幕截图,因为压缩会降低检测器依赖的频率信号
- 将图像上传到显示每个区域置信度的AI图片检测器(而不仅仅是单个分数)
- 使用Jeffrey's Exif Viewer等免费工具单独检查EXIF元数据——注意相机数据是否存在
- 运行反向图像搜索(Google Images或TinEye),查看图像是否出现在与其呈现方式不一致的背景中
- 手动查看检测器标记的区域——检查手指、牙齿、头发边缘、背景文字和眼镜或眼睛中的倒影
- 如果检测器分数在40-70%范围内,将其视为不确定,并将你的手动检查权重加重于这个数字
- 对于高风险决策,将同一张图片上传到第二个AI检测器并比较分数——在工具之间获得一致的结果比单次读取更可靠
AI图片检测器的错误之处
没有一个AI图片检测器是百分百正确的,了解故障模式可以防止你过度依赖分数。误判——将真实照片标记为AI——比大多数工具披露的更常见。专业摄影带有重度后期处理(强晕影、皮肤修饰、HDR色调映射)可以产生类似AI输出的频率特征。库存照片经常在出售前进行大量编辑和剥离EXIF数据,特别容易产生误判。如果你对高度修饰的商业证件照进行AI图片检测器检查,即使原始照片是用相机拍摄的,误判结果也是完全可能的。漏判——未能识别AI生成的图像——最常发生在图像在生成后已被处理的情况。AI生成的图像通过照片滤镜应用程序、打印后重新拍照或重度JPEG压缩后会失去足够的合成信号,使检测器无法捕捉它。一些用户通过添加胶片颗粒叠加或在分享前通过仿真拟真滤镜来故意规避这一点。人口统计学偏差是AI图片检测中的一个已知问题,类似于在标记人类写作的AI文本检测器中发现的情况。主要在西方面孔和摄影风格上训练的检测模型在其他主题上的准确性较低。这意味着真实照片中的人物肤色或面部特征在训练数据中代表不足,可能被标记为AI的比率高于应有的比率。使用任何AI图片检测器工具的正确方式是作为概率过滤器,而不是判决:高分数意味着需要进一步调查,而不是确定存在伪造。
哪些类型的图片最难被AI检测器捕捉
并非所有AI生成的图片都同样易于检测。了解哪些类型更难被捕捉有助于你在不同情况下对检测器分数进行适当的权衡。由专用肖像AI工具(如Remini或Lensa的AI模式)生成的肖像照片是标准AI图片检测工具最难可靠标记的类型之一,因为这些工具将真实照片输入与AI合成相融合——输出中已经烘烤了一些真实的相机噪声。来自Midjourney v6或更高版本的风景和自然图像在视觉上通常令人信服,但往往保留足够的频域伪影,使检测器能以比肖像更高的速率捕捉它们。AI生成的图片背景中的文字通常是乱码或使用无意义的字符——检测器可能会在算法上捕捉到这一点,但人类审阅者也可以在几秒内发现。经历多代压缩的图像——在WhatsApp上分享、下载、重新上传到Instagram——在任何方向上都更难正确分类。压缩噪声会压倒检测器使用的某些信号。产品模型图像和程式化插图确实具有歧义性:平面设计师在包含真实摄影和手动编辑的工作流程中使用AI,结果是一个混合来源的图像,没有AI图片检测器算法可以可靠地分类。当图像的AI来源真的不确定时,将其视为较低置信度的结果并进行额外的手动检查是更有防守的方法。
"当你拥有原始文件时,检测器分数最有意义。一旦图像经过四个压缩周期,你分析的更多是压缩而不是图像。"
AI图片检测最重要的时刻
知道何时使用AI图片检测器——以及何时采用不同的验证方法更有用——会使这个工具在实践中更有效。学术环境是一个日益增长的用例:要求学生提交现场工作或实验室实验照片文档的讲师越来越多地遇到AI生成的图像被提交为真实文档。AI图片检测器能够捕捉最明显的伪造,尽管理解该技术的有决心的学生有时可以通过应用后期处理来避免检测。新闻与事实核查是AI图片检测最高风险的环境。在突发新闻周期期间在社交媒体上分享的公众人物在真实世界事件中的合成图像可以比任何更正传播得更快。已建立检测工作流程的新闻编辑室——结合反向图像搜索、元数据检查和AI图片检测器——在发布前捕捉到大多数明显的假货。对于视频中的深度伪造检测,相同的原理逐帧应用,尽管视频工具有一个额外的信号:跨帧的时间一致性,这是单一图像检测器无法访问的。人力资源和身份验证团队检查提交的档案照片有更直接的任务:大多数由AI肖像服务生成的虚假证件照显示可检测的伪影,运行AI图片检测器检查作为申请筛选工作流程的一部分会增加有意义的验证层而无需显著增加时间。对于个人使用——检查你收到的图像是否真实,然后再分享——免费的基于浏览器的AI图片检测器完全足够。个人使用的目标不是法医级别的确定性;而是一个快速、有根据的判断,判断图像在传递之前是否值得进一步审查。NotGPT的AI图像检测让你可以上传任何图片并在几秒内获得概率分数,突出显示对结果贡献最大的图像区域——这比单个没有解释的数字更有用。
使用NotGPT检测AI内容
AI Detected
“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”
Looks Human
“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”
即时检测AI生成的文本和图像。一键将内容人性化。
相关文章
检测功能
AI文本检测
粘贴任何文本并获得AI相似度概率分数及高亮部分。
AI图像检测
上传图像以检测它是否由DALL-E或Midjourney等AI工具生成。
人性化
将AI生成的文本改写为自然音。选择轻、中或强强度。