Skip to main content
guideai-detectiondeepfakes

深度伪造检测工具:工作原理和可信工具指南

· 7 min read· NotGPT Team

随着AI生成的面部、声音和视频泛滥于社交媒体、新闻源和招聘流程,深度伪造检测工具已成为实际需要。无论你需要验证病毒式传播的照片、审查可疑的视频录音,还是检查求职申请上的头像是否真实,这些工具都能提供帮助——尽管没有一个工具是完全可靠的。本指南涵盖深度伪造检测工具的工作原理、当今可用的主要类别,以及其真实世界的准确性。

什么是深度伪造检测工具?

深度伪造检测工具是软件程序——桌面应用、浏览器扩展或API——旨在识别使用AI合成或处理的媒体。术语"深度伪造"最初指的是用深度学习创建的换脸视频(因此得名),但该类别已扩展到包括使用Midjourney或Stable Diffusion等工具生成的AI图像、由ElevenLabs或类似服务产生的声音克隆,以及冒充人类写作的合成文本。深度伪造检测工具通常通过训练有素的分类器运行输入,返回概率分数——例如"84%可能由AI生成"——以及有关媒体哪些部分触发标记的视觉或文本线索。这些工具解决的问题是真实的:Sumsub在2024年的报告发现深度伪造欺诈尝试同比增长10倍,最常见的目标是身份验证检查、视频面试和社交媒体资料。

深度伪造检测工具如何工作

大多数深度伪造检测工具依赖以下三种核心技术中的一种或多种:伪影分析、频域分析和元数据检查。伪影分析寻找AI图像生成器仍然产生的微妙视觉不一致——例如发际线附近的皮肤纹理不匹配、牙齿模糊、不对称的耳朵形状或手指数量错误的手。这些错误源于扩散模型和GAN(生成对抗网络)逐区域合成像素,而不是全局理解解剖学的方式。频域分析使用快速傅里叶变换将图像转换为其频率分量。真实相机照片具有来自传感器的自然噪声模式;AI生成的图像具有不同的频谱特征,在高频段中显示为规则图案——一种生成器难以隐藏的数字指纹。元数据检查检查EXIF数据和C2PA内容凭证。在iPhone上拍摄的合法照片将携带GPS坐标、时间戳和摄像机型号。AI生成的图像通常没有这些信息,或者有手动之后插入的元数据。一些专业工作流现在使用C2PA标准(由Adobe、Microsoft和BBC支持)嵌入加密溯源,这样任何篡改都会使签名失效。

"大多数深度伪造检测工具失败不是因为底层科学错误,而是因为这些工具是用昨天的生成器训练的——不是今天的。" — MIT媒体实验室研究员(2024年)

深度伪造检测工具的主要类别

并非所有深度伪造检测工具都能处理相同类型的媒体。了解类别有助于为工作选择合适的工具。视频深度伪造检测器——如Sensity AI、Oz Forensics和已停用的Microsoft Video Authenticator等工具——分析视频帧之间的时间一致性。实时录制的真实面部保持一致的照明和微表情;换脸视频通常在合成面部与真实颈部或头发之间的边界处显示微妙闪烁。AI图像检测器专注于静止图像,更广泛可用。这些包括基于浏览器的工具如Hive Moderation、AI or Not和NotGPT的AI图像检测功能,可检查上传的照片是否由DALL-E、Midjourney或Stable Diffusion等模型生成。声音深度伪造检测器——如Pindrop、Resemble AI和ElevenLabs自己的检测端点等公司——分析音频中的韵律、呼吸模式和频率伪影,以识别合成语音。元数据和溯源工具根本不分析内容;它们验证监管链。Adobe的内容真实性倡议和C2PA标准让发布者为原始照片附加加密签名,这样链下游的深度伪造检测工具可以确认图像是否被修改。

  1. 对于可疑照片:使用分析GAN/扩散伪影的AI图像检测器
  2. 对于视频片段:使用Sensity或Oz Forensics等时间帧一致性工具
  3. 对于语音录音:尝试Pindrop或Resemble Detect等声音活跃度检测器
  4. 对于专业媒体工作流:查找发布者嵌入的C2PA内容凭证
  5. 当不存在溯源时:在仅依赖AI分数之前,使用反向图像搜索(Google图像、TinEye)进行交叉参考

特定用例的深度伪造检测工具

不同的专业在非常不同的背景下遇到深度伪造。验证病毒式传播图像的记者需要一个快速、免费的浏览器工具,不需要将敏感材料上传到第三方服务器。筛选视频面试的人力资源团队需要可以标记简历上AI生成头像或异步面试平台上合成声音的东西。需要认证证据的法律专业人士需要具有可审计输出的工具——一份他们可以附加到文件的报告,而不仅仅是网站上的概率分数。对于记者和事实核查人员,反向图像搜索和AI图像检测器的组合涵盖大多数情况。如果图像在Google反向图像搜索中返回零结果,但据称是在真实事件中拍摄的,这是值得用像素级深度伪造检测工具进一步调查的红旗。对于人力资源团队,最实用的检查是要求候选人在现场视频通话中举着手写便签——这是AI视频工具仍在实时努力的事情。用AI图像检测器补充提交的头像扫描可以捕捉大多数假个人资料照片。对于大规模内容审核,唯一可行的途径是集成到上传管道中的基于API的深度伪造检测工具,而不是手动审查。

  1. 新闻业:首先通过反向图像搜索运行图像,然后使用AI图像检测器
  2. 人力资源筛选:要求现场视频确认;用图像检测器扫描提交的头像
  3. 法律证据:使用生成具有置信区间的文档报告的工具
  4. 社交平台:将基于API的检测器集成到媒体上传管道中
  5. 个人使用:免费浏览器工具(AI or Not、NotGPT)足以进行一次性检查

深度伪造检测工具无法检测的内容

对深度伪造检测工具的诚实报道必须包括其故障模式,因为对这些系统的过度自信会带来自身的问题。最重要的限制是军备竞赛动力:生成器和检测器以竞争方式训练,生成器目前正在获胜。在2023年Midjourney输出上训练的深度伪造检测工具将错过许多2025年Midjourney v7输出,因为较新的模型产生的图像明显更逼真,伪影更少——检测器被训练来识别这些伪影。高度JPEG压缩、Instagram过滤器和截图重新上传都会降低检测器依赖的信号。真实的AI生成图像如果被截图并重新上传五次,可能会因为压缩冲淡了频率伪影而对深度伪造检测工具显示为"可能是人类"。假阳性仍然是一个严重问题,尤其是对于非西方面孔和专业摄影。多项研究证实,主要在西方面孔上训练的检测模型在其他人口统计学群体上表现更差——以更高的比率将真实照片标记为合成。这是关于AI文本检测器标记合法人类写作的讨论中涵盖的相同偏见问题。正确的心理模型是将这些工具视为第一级分类过滤器,而不是判决。高AI分数值得进一步调查;它不能证明伪造。

"任何深度伪造检测工具都不应该是指控的唯一基础。将高分数视为与指纹匹配相同的方式:值得调查,不值得定罪。"

如何有效选择和使用深度伪造检测工具

鉴于市场上深度伪造检测工具的多样性,以下是选择工具时真正重要的标准。当前生成器的准确性比旧测试集上的基准分数更重要。寻找发布其训练数据年份并定期更新的工具。关于置信区间的透明度很重要——提供"98% AI"且没有解释其方法的工具比显示哪些区域触发标记的工具更难信任。对于特别是AI生成图像,NotGPT的AI图像检测通过模型运行上传,该模型经过训练以识别当前生成器的输出,包括Midjourney、DALL-E 3和Stable Diffusion,并突出显示对分数贡献最大的图像区域。对于您还需要检查文本的混合工作流——例如验证提交的文章或简历是否由AI编写——将图像检测器与文本检测器结合提供比单独任何一个更好的覆盖。使用任何深度伪造检测工具的最佳方法是将其视为更广泛验证过程中的一个数据点:检查溯源、交叉参考来源、查找上下文不一致,使用工具的分数来确定哪些项目值得进行更仔细的人工审查。

  1. 将图像上传或将文本粘贴到显示哪些区域触发标记的检测器中
  2. 使用Jeffrey的Exif Viewer等免费工具检查EXIF元数据
  3. 运行反向图像搜索,查看图像是否在其他不同背景下出现过
  4. 如果分数不明确(40-70% AI),寻找背景红旗而不是仅依赖数字
  5. 对于高风险决策,从不同的深度伪造检测工具获取第二意见
  6. 记录您的验证过程——截图分数并记录时间戳

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。