Skip to main content
ai-detectiondeepfakesinformational

Detekcja deepfake'ów: Jak to działa, dlaczego ma znaczenie i gdzie ma braki

· 9 min read· NotGPT Team

Detekcja deepfake'ów to proces określania, czy dany fragment media — zdjęcie, wideo lub nagranie audio — został utworzony lub zmanipulowany przy użyciu sztucznej inteligencji. W miarę jak modele generatywne AI stają się bardziej zaawansowane, luka między mediami rzeczywistymi a syntetycznymi ciągle się zmniejsza, co sprawia, że detekcja jest zarówno bardziej pilna, jak i trudniejsza. Ten artykuł omawia naukę stojącą za detekcją deepfake'ów, wyjaśnia, dlaczego istniejące metody mają trudności w nadążeniu za nowymi generatorami i opisuje, co mogą zrobić zwykli ludzie, gdy spotykają podejrzaną zawartość.

Czym jest detekcja deepfake'ów i dlaczego ma znaczenie?

Detekcja deepfake'ów odnosi się do każdej metody — automatycznej lub manualnej — używanej do identyfikacji mediów, które zostały syntetycznie wygenerowane lub zmienione za pomocą AI. Termin "deepfake" został ukuty w 2017 roku, gdy użytkownik Reddit'a zaczął publikować AI-wymieniane twarze celebrytów, ale technologia ewoluowała daleko poza zamiany twarzy. Nowoczesne generatory takie jak Midjourney, Stable Diffusion, Sora i ElevenLabs mogą tworzyć fotoreaalistyczne obrazy, pełnowymiarowe wideo i niemal doskonałe klony głosów z niczego więcej niż z zachęty tekstowej. Stawki nie są teoretyczne. W lutym 2024 roku pracownik finansowy z firmy inżynierskiej w Hongkongu został zmuszony do przelania milionów dolarów po wzięciu udziału w wideoczacie, w którym każdy inny uczestnik — w tym dyrektor finansowy firmy — był deepfake'iem. Polityczne deepfake'i zaburzyły wybory na Słowacji, Bangladeszu i w Stanach Zjednoczonych. Oszuści romansowi używają AI-generowanych twarzy do budowania fałszywych profili. A uczniowie przesłali AI-wygenerowane zdjęcia na legitimację ID. Detekcja deepfake'ów ma znaczenie, ponieważ zaufanie do dowodów wizualnych i audio jest podstawą dziennikarstwa, egzekwowania prawa, transakcji finansowych i osobistych relacji. Kiedy to zaufanie się załamuje, konsekwencje wykraczają daleko poza jakikolwiek pojedynczy przekręt lub wiralny hoax.

Nauka stojąca za detekcją deepfake'ów

Detekcja deepfake'ów opiera się na fakcie, że generatory AI, bez względu na to, jak zaawansowane, pozostawiają ślady, które różnią się od mediów rzeczywistych. Te ślady należą do kilku kategorii, a większość systemów detekcji wykorzystuje kombinację ich do wydania orzeczenia.

  1. Analiza artefaktów na poziomie pikseli: Rzeczywiste kamery przechwytują światło przez fizyczną soczewkę i czujnik, tworząc naturalne wzory szumów. Generatory AI syntetyzują piksele matematycznie, co może powodować subtelne niespójności — niedopasowane tekstury skóry, nieregularne odbicia w oczach, zęby, które się łączą, lub kolczyki, które pojawiają się tylko po jednej stronie. Modele detekcji wytrenowane na tysiącach rzeczywistych i fałszywych obrazów uczą się dostrzegać te wzory.
  2. Analiza w domenie częstotliwości: Kiedy konwertujesz obraz na jego komponenty częstotliwości za pomocą transformaty Fouriera, rzeczywiste zdjęcia i obrazy generowane przez AI wyglądają inaczej. Szum czujnika kamery tworzy charakterystyczne spektrum, które brakuje obrazom syntetycznym. Niektóre systemy detekcji deepfake'ów działają prawie wyłącznie w domenie częstotliwości, ponieważ różnice te są trudniejsze do zamaskowania dla generatorów.
  3. Testy spójności czasowej (wideo): W deepfake'ach wideo, spójność klatka po klatce jest trudna do utrzymania. Migotanie wokół krawędzi twarzy, nienaturalne wzory mrugania, przesunięcia oświetlenia między klatkami i niedopasowania synchronizacji warg służą jako sygnały detekcji. Niektóre systemy analizują przepływ optyczny — ruch pikseli między klatkami — aby znaleźć nieciągłości.
  4. Analiza audio: Deepfake'i klonowania głosu można wykryć za pomocą analizy spektralnej. Sklonowane głosy często brakuje mikro-wariacji w wysokości tonu, dźwięków oddechu i akustyki pokoju obecnych w autentycznych nagraniach. Niektóre metody detekcji porównują częstotliwości formantów — wzory rezonansu, które czynią każdy głos unikatowym — względem znanych próbek.
  5. Inspekcja metadanych i pochodzenia: Autentyczne zdjęcia zawierają dane EXIF — współrzędne GPS, model kamery, znaczniki czasu. Obrazy generowane przez AI zazwyczaj nie mają metadanych lub zawierają metadane, które zostały ręcznie wstawione. Standard C2PA (wspierany przez Adobe, Microsoft, Google i BBC) osadza podpisy kryptograficzne w mediach w momencie tworzenia, więc każde następne manipulowanie unieważnia podpis.
  6. Analiza semantyczna: Niektóre podejścia do detekcji szukają niespójności logicznych, które ludzie mogą pominąć na pierwszy rzut oka — cień padający w złym kierunku, tekst na znaku w tle, który jest bezsensowny, lub biżuteria, która zmienia się między ujęciami. Wymagają one modeli z pewnym rozumieniem, jak funkcjonuje świat fizyczny.

Typy deepfake'ów i jak każdy jest wykrywany

Nie wszystkie deepfake'i są tworzone równo. Podejście do detekcji zależy w dużej mierze od rodzaju zaangażowanych mediów syntetycznych.

  1. Zamiany twarzy: Oryginalna kategoria deepfake'ów. Twarzy źródłowej jest mapowana na twarz docelową w wideo. Detekcja skupia się na granicach mieszania — szwie, gdzie zamieniona twarz spotyka się z oryginalną głową — i niespójnościach w oświetleniu, tonacji skóry i pozie głowy między twarzą a ciałem.
  2. W pełni syntetyczne obrazy: Wygenerowane od zera przy użyciu modeli dyfuzji lub GAN'ów. Nie mają "oryginału" do porównania, więc detekcja opiera się na analizie artefaktów i sygnaturach częstotliwości. Typowe oznaki obejmują zbyt gładką skórę, doskonale symetryczne cechy i tła, które rozpuszczają się w niespójne wzory na krawędziach.
  3. Deepfake'i synchronizacji warg: Osoba jest rzeczywista, ale ruchy jej ust zostały zmienione, aby dopasować się do różnych nagrań audio. Metody detekcji analizują związek między fonemami (dźwiękami mowy) a wizerunkami (kształtami ust) — deepfake'i synchronizacji warg często źle mapują to, zwłaszcza dla dźwięków takich jak "f", "v" i "th".
  4. Klony głosu: Dźwięk syntetyczny wygenerowany w celu naśladowania konkretnej osoby. Detekcja obejmuje analizę spektrogramów pod kątem nienaturalnej gładkości, sprawdzenie braku artefaktów oddechu i porównanie wzorów podstawowej częstotliwości z znanymi nagraniami mówcy docelowego.
  5. Tekst na wideo: Nowsze generatory takie jak Sora i Runway tworzą pełne wideo z monitów tekstowych. Są one trudniejsze do wykrycia za pomocą tradycyjnych metod zamiany twarzy, ponieważ nie ma granicy mieszania. Detekcja zależy od naruszeń fizyki — obiekty przechodzące przez siebie nawzajem, niespójna grawitacja lub niemożliwe odbicia.
"Wyzwanie detekcji deepfake'ów jest fundamentalnie asymetryczne: obrońcy muszą złapać każdą usterkę, podczas gdy atakujący muszą tylko raz oszukać detektor." — Hany Farid, badacz cyfrowej kryminalistyki UC Berkeley

Dlaczego detekcja deepfake'ów staje się trudniejsza

Wyścig zbrojeń między twórcami deepfake'ów a systemami detekcji deepfake'ów był jednostronny i zmierza na korzyść twórców. Jest kilka strukturalnych powodów tego. Po pierwsze, generatory ulepszają się szybciej niż detektory. Kiedy nowy model takie jak Flux lub Stable Diffusion 3 się uruchamia, zwykle unika istniejących systemów detekcji przez tygodnie lub miesiące, aż te systemy zostaną przeszkolone. Modele detekcji są inherentnie reaktywne — mogą się tylko uczyć dostrzegać to, co już widziały. Po drugie, problem danych treningowych jest okrężny. Modele detekcji potrzebują przykładów mediów syntetycznych do nauki, ale każdy nowy generator tworzy media o różnych charakterystykach. Detektor wytrenowany wyłącznie na twarzach generowanych przez GAN'y będzie brakować wyjść modelu dyfuzji i odwrotnie. Budowanie zestawu treningowego, który obejmuje wszystkie obecne generatory, to ruchomy cel. Po trzecie, techniki niezgodne specjalnie zaprojektowane do pokonania detektorów stają się bardziej dostępne. Dodanie niezauważalnego szumu do obrazu generowanego przez AI może go przesunąć poza klasyfikator detekcji. Niektóre narzędzia teraz oferują funkcje "anty-detekcji" jako punkt sprzedaży. Po czwarte, kompresja i przetwarzanie mediów społecznościowych usuwają wiele subtelnych sygnałów, na które detektory się opierają. Kiedy fałszywy obraz deepfake'u zostaje przesłany do Instagram'u lub WhatsApp'a, platforma ponownie go koduje, zmniejszając rozdzielczość i zmieniając widmo częstotliwości. System detekcji może złapać oryginalny fałsz o wysokiej rozdzielczości, ale przegapić ten sam obraz po kompresji platformy. Wreszcie, w miarę jak modele tekstu na wideo dojrzewają, liczba wykrywalnych artefaktów spada z każdym pokoleniem. Wczesne podglądy Sora miały oczywiste błędy fizyki, ale nowsze wyniki z komercyjnych generatorów wideo są coraz trudniejsze do odróżnienia od rzeczywistych materiałów filmowych bez starannej analizy klatka po klatce.

Praktyczna detekcja deepfake'ów: Co możesz zrobić teraz

Chociaż żadna pojedyncza metoda nie gwarantuje doskonałej detekcji deepfake'ów, wielowarstwowe podejście znacznie zwiększa szanse na złapanie mediów syntetycznych zanim spowoduje szkodę.

  1. Użyj najpierw wyszukiwania obrazem odwrotnym. Google Lens, TinEye lub Yandex Images mogą ujawnić, czy podejrzane zdjęcie było używane gdzie indziej, czy też pasuje do znanego AI-generowanego obrazu. To zajmuje sekundy i łapie zaskakująco wiele fałszów.
  2. Sprawdź metadane. Kliknij prawym przyciskiem myszy na obraz i sprawdź jego właściwości lub użyj przeglądarki EXIF. Zdjęcie bez informacji o aparacie, bez danych GPS i bez historii edycji jest podejrzane. Poszukaj poświadczeń treści C2PA, gdy są dostępne — to jest najbardziej niezawodny sygnał pochodzenia, który jest aktualnie wdrażany.
  3. Uruchom zawartość przez narzędzie do detekcji AI. Przesyłaj obrazy do detektora obrazów AI, który używa modeli klasyfikatorów wytrenowanych na wyjściach z obecnych generatorów. W przypadku tekstu towarzyszącego podejrzanym mediom (podpisy, artykuły, posty mediów społecznościowych), użyj narzędzia do detekcji tekstu, aby sprawdzić, czy pismo zostało wygenerowane przez AI.
  4. Ręcznie poszukaj czerwonych flag kontekstowych. Czy osoba w wideo mruga naturalnie? Czy ich kolczyki pasują? Czy tekst na znakach w tle jest czytelny? Czy cienie padają konsekwentnie? Te ręczne kontrole łapią rzeczy, które zautomatyzowane narzędzia czasami przegapią.
  5. Zweryfikuj za pośrednictwem niezależnych źródeł. Jeśli widzisz wideo publicznej osoby składającej zaskakujące oświadczenie, sprawdź, czy renomowane media to zaraportowały. Jeśli jedynym źródłem jest pojedynczy post w mediach społecznościowych, traktuj go z sceptycyzmem, niezależnie od tego, jak przekonujący wygląda.
  6. Zgłoś i udokumentuj. Jeśli identyfikujesz deepfake'a, zgłoś to platformie, na której go znalazłeś. Zrób zrzut ekranu zawartości, zanotuj adres URL i znacznik czasu oraz zachowaj rekord. Platformy coraz bardziej reagują na raporty deepfake'ów, zwłaszcza gdy dotyczą kradzieży tożsamości lub ingerencji wyborczych.

Detekcja deepfake'ów w określonych dziedzinach

Różne branże stoją w obliczu różnych wyzwań podczas identyfikacji mediów syntetycznych, a podejścia, które działają w jednym kontekście, mogą nie przeniknąć do innego. W dziennikarstwie i faktycznym weryfikowaniu organizacje takie jak Reuters, AFP i Bellingcat zintegrowały detekcję deepfake'ów ze swoimi przepływami pracy weryfikacyjnej. Reporterzy używają kombinacji analizy metadanych, wyszukiwania obrazem odwrotnym i wyspecjalizowanych narzędzi detekcji przed publikacją wszelkich zawartości wizualnych przesłanych przez użytkowników. Associated Press wymaga teraz danych pochodzenia C2PA dla wszystkich zdjęć wewnętrznie produkowanych. W zatrudnianiu i HR, detekcja deepfake'ów stała się istotna, gdy wywiady wideo przeszły online. Pojawiły się przypadki, gdy kandydaci używali technologii zamiany twarzy w czasie rzeczywistym podczas rozmów Zoom, prezentując inny wygląd niż osoba, która faktycznie by pokazała się do pracy. Niektóre firmy teraz wymagają od kandydatów wykonywania konkretnych czynności przed kamerą (obracanie głowy, podnoszenie ręki) jako lekkiej kontroli autentyczności. W egzekwowaniu prawa i postępowaniach sądowych, dopuszczalność dowodów wizualnych coraz bardziej zależy od pochodzenia. Sądy w kilku jurysdykcjach zaczęły wymagać uwierzytelniania dowodów cyfrowych, a niektóre laboratoria kryminalistyczne teraz rutynowo prowadzą analizę mediów syntetycznych na przesłanych zdjęciach i wideo. W edukacji, detekcja deepfake'ów przecina się z uczestnictwem akademickim, gdy uczniowie przesyłają zdjęcia profilu generowane przez AI w celu weryfikacji tożsamości lub używają syntetycznych głosów do nagranych prezentacji. Szkoły zaczynają adoptkę kroki uwierzytelniania mediów obok istniejących opracowań AI do pisemnych zadań. W usługach finansowych, detekcja deepfake'ów jest krytyczna dla weryfikacji KYC (Znaj Swojego Klienta). Banki i giełdy kryptowalut zgłosiły przypadki, gdy wnioskodawcy przesłali zdjęcia ID generowane przez AI lub używali narzędzi zamiany twarzy w żywe, aby przejść kontrole weryfikacyjne. Systemy detekcji w tej przestrzeni analizują sygnały żywości — proszą użytkowników, aby mrugali, uśmiechali się lub obracali głowę — w połączeniu z uwierzytelnianiem dokumentów.

Przyszłość detekcji deepfake'ów

Technologia detekcji deepfake'ów ewoluuje wzdłuż kilku równoległych ścieżek. Podejścia oparte na pochodzeniu, takie jak C2PA, zyskują na znaczeniu, ponieważ nie próbują wykrywać fałszów po fakcie — zamiast tego dowodzą, że autentyczna zawartość jest rzeczywista. Jeśli zostanie szeroko przyjęta, to przesunęłoby obciążenie: zawartość bez podpisu byłaby domyślnie traktowana jako niezweryfikowana. Pojawiają się również rozwiązania na poziomie sprzętu. Niektórzy producenci smartfonów badają bezpieczne tryby przechwytywania, w których aparat podpisuje każde zdjęcie kluczem kryptograficznym specyficznym dla urządzenia w momencie przechwycenia, co czyni każdą manipulacją wykrywalną. Po stronie AI, multimodalne systemy detekcji, które analizują obraz, audio i tekst jednocześnie, wykazują obiecujące wyniki. Film deepfake'ów ze sklonowanym audio i syntetyczną napisem wyzwala różne sygnały w modalności, a krzyż-weryfikacja tych sygnałów zmniejsza fałszywe alarmy. Rejestry mediów oparte na blockchanie, choć przesadnie rozreklamowane w niektórych implementacjach, mogły zapewnić tamperproof czasów dla tworzenia zawartości. Jeśli zdjęcie jest zarejestrowane na blockchain'ie o 14:00 i zmieniona wersja pojawia się o 15:00, sam osi czasu staje się dowód. Najbardziej realistycznym wynikiem krótkoterminowym nie jest pojedyncze narzędzie detekcji, które łapie wszystko, ale ekosystem weryfikacji — kombinacja standardów pochodzenia, klasyfikatorów detekcji, polityk platform i umiejętności czytania mediów — która sprawia, że tworzenie przekonujących deepfake'ów jest droższe i czyni weryfikowanie zawartości bardziej dostępnym.

Jak NotGPT pomaga w detekcji deepfake'ów

NotGPT udostępnia dwie funkcje bezpośrednio istotne dla detekcji deepfake'ów. Narzędzie do detekcji obrazów AI pozwala przesłać dowolny obraz i otrzymać wynik prawdopodobieństwa wskazujący, czy został wygenerowany przez model AI. Analizuje artefakty wizualne, wzory częstotliwości i niespójności strukturalne na całym obrazie. Narzędzie do detekcji tekstu AI uzupełnia to poprzez analizę tekstu, który często towarzysza mediom deepfake'ów — podpisy mediów społecznościowych, artykuły fake news lub wiadomości phishingowe. Ponieważ kampanie deepfake'ów często łączą wizualne syntetyka z tekstem generowanym przez AI, sprawdzenie zarówno mediów, jak i towarzyszącego tekstu daje bardziej kompletny obraz. Oba narzędzia działają na Twoim urządzeniu bez przesyłania zawartości do serwerów zewnętrznych, co ma znaczenie przy weryfikacji poufnych lub prywatnych mediów.

Wykrywaj treści AI z NotGPT

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

Natychmiastowo wykrywaj tekst i obrazy generowane przez AI. Humanizuj swoje treści jednym dotknięciem.