Skip to main content
ai-detectionguideexplainer

Cum funcționează detectoarele ChatGPT? O explicație în limbaj simplu

· 10 min read· NotGPT Team

Înțelegerea modului în care funcționează detectoarele ChatGPT este practic util pentru studenți care trimit lucrări, editori care analizează conținuturile freelancerilor și instructori care întâlnesc lucrări marcate și trebuie să judece dacă un scor reprezintă dovezi semnificative sau zgomot statistic. Aceste instrumente sunt clasificatori de învățare automată care măsoară două semnale principale în text — perplexity și burstiness — și oferă o estimare a probabilității că pasajul a fost generat de un model de limbaj mai degrabă decât scris de o persoană. Scorul nu este un verdict, iar decalajul dintre un rezultat și o concluzie fiabilă este locul în care apare majoritatea neînțelegerilor despre aceste sisteme.

Cum funcționează detectoarele ChatGPT la nivel statistic?

Cum funcționează detectoarele ChatGPT la cel mai fundamental nivel? Ele reduc întrebarea despre autorie la o problemă statistică, comparând proprietățile măsurabile ale unui text dat cu ceea ce a învățat clasificatorul din mostre mari de text scris uman și text generat de AI. Detectoarele ChatGPT sunt clasificatori de învățare automată antrenați pe colecții mari de text scris uman și text generat de AI din modele inclusiv GPT-4, Claude, Gemini și Llama. În timpul antrenării, clasificatorul învață care proprietăți statistice disting cele două categorii — în principal cât de previzibil este fiecare alegere de cuvânt în contextul lui și cât de consecvent rămân lungimea și structura propoziției în tot documentul. În timp de inferență, instrumentul primește textul de intrare, extrage acele caracteristici și produce un număr între 0 și 100 reprezentând cât de strâns profilele statistic ale textului se potrivesc cu ceea ce modelul a învățat din probe de antrenare generate de AI. Două abordări tehnice principale există: modele clasificatoare ajustate care trec intrarea printr-un transformer și citesc reprezentarea de pe stratul final, și detectoare bazate pe marca de apă care verifică o semnătură statistică încorporată în jetoane în timp de generare. Cele mai multe instrumente orientate către consumator — GPTZero, Copyleaks, caracteristica de detecție AI a Turnitin și NotGPT — utilizează abordarea clasificatorului ajustat, deoarece detecția mărcii de apă necesită cooperare din sistemul de generare și nu funcționează pe text din orice model care nu a încorporat semnătura în timpul generării.

Ce este Perplexity și de ce este important?

Perplexity este o măsură a modului în care un model de limbaj ar fi surprins de fiecare cuvânt dintr-un pasaj, luând în considerare cuvintele care îl preced. Când un model AI generează text, selectează jetonul cel mai probabil din punct de vedere statistic la fiecare poziție — producând proză care, prin design, are perplexity scăzut în raport cu distribuția de antrenare a modelului. Scriitorii umani nu optimizează pentru probabilitatea jetonului: ajung la formulări neobișnuite, schimbă registrul la jumătatea unui paragraf și fac alegeri de cuvinte care se potrivesc cu vocea lor personală mai degrabă decât cu opțiunea statistic cea mai sigură, rezultând într-un perplexity agregat mai mare decât rezultatul generat de AI pe același subiect. Detectoarele ChatGPT exploatează această asimetrie prin trecerea intrării printr-un model de limbă de referință, colectarea probabilităților logaritmice atribuite fiecărui jeton și agregarea lor într-un singur scor. Perplexity agregat scăzut crește estimarea probabilității AI; perplexity înalt sugerează alegeri de cuvinte pe care un model de limbă le-ar găsi surprinzătoare, ceea ce este un semnal asociat cu autoria umană. Complicația este că anumite categorii de scriere umană — documentație tehnică, proză academică formală, conținut editat atent — obțin și perplexity scăzut pentru că se bazează pe vocabular constrâns și convenții de gen, ceea ce este exact locul în care provin falsurile pozitive.

Perplexity măsoară cât de previzibil este fiecare alegere de cuvânt în contextul lui. Textul generat de AI este, aproape prin construcție, cu perplexity scăzut — modelul selectează jetonul cel mai probabil la fiecare pas, iar această previzibilitate este exact ceea ce sunt antrenați să găsească detectoarele.

Ce este Burstiness și cum o utilizează detectoarele?

Burstiness surprinde variația lungimii propoziției și complexității structurale în întregul document. Scriitorii umani produc în mod natural text cu burstiness ridicat: un paragraf ar putea să se deschidă cu o observație scurtă și directă, urmată de o propoziție lungă care adaugă calificări și context, apoi să se închidă cu o afirmație de lungime medie care avansează argumentul. Această variație nu este o alegere stilistică deliberată — este un produs secundar al modului în care gândirea umană produce scriere, urmând impulsul cognitiv și presiunea contextuală mai degrabă decât un țintă de optimizare a fluidității. Modelele AI tind să genereze text cu burstiness scăzut pentru că optimizează pentru o ieșire lin și ușor de citit la fiecare pas de jeton, producând propoziții care se grupează într-un interval de lungime consistent și urmează modele structurale previzibile în tot paragraful. Detectoarele calculează burstiness prin măsurarea varianței statistice în distribuții de lungime a propoziției în tot documentul: varianță scăzută crește estimarea probabilității AI, în timp ce varianță ridicată — în special un amestec de propoziții foarte scurte și lungi în aceeași secțiune — este un semnal puternic către autoria umană. Aceasta este motivul pentru care amestecarea deliberată a lungimii propoziției în secțiunile marcate tinde să reducă scorurile de detecție: restabilește semnalul burstiness pe care îl lipsește rezultatul consistent al AI.

Modelele AI optimizează fluiditatea la o dată de jeton, producând o ieșire ritmic consecventă ca efect secundar. Scriitorii umani urmează fluxul gândurilor lor, iar variația rezultată în lungimea propoziției este semnalul burstiness pe care detectoarele îl măsoară.

Cum produc detectoarele un scor de încredere?

Rezultatul majorității detectoarelor ChatGPT este un procent — etichetat ca probabilitate AI, încredere generată de AI sau descriptor similar. Acest număr este estimarea clasificatorului că textul aparține clasei generate de AI, pe baza combinației măsurate de perplexity, burstiness și orice caracteristici suplimentare pe care modelul specific a fost antrenat. Un rezultat de 80 la sută AI nu înseamnă că detectorul este 80 la sută sigur pe documentul complet: înseamnă că caracteristicile textului se situează la al 80-lea percentil al distribuției probabilității probabilității AI pe care clasificatorul a învățat-o în timpul antrenării, ceea ce este o revendicare diferită și mai complexă din punct de vedere interpretativ. Majoritatea platformelor aplică un prag — de obicei 60 până la 80 la sută — deasupra căruia rezultatele sunt raportate ca probabil generate de AI, dar pragul specific afectează ratele fals pozitive și adevărate pozitive în direcții opuse: praguri mai mici surprind mai mult conținut AI, dar flagează mai mult scriere umană; praguri mai mari reduc alarmele false cu prețul ratării mai mult text generat de AI. Variabilitatea scorului pe platforme este unul dintre semnalele cel mai practic util despre fiabilitate: un document care obține 78 la sută pe un detector și 42 la sută pe altul nu se află în regiunea în care clasificarea unui instrument ar trebui tratată ca definitiv, deoarece textul ocupă o zonă statistică în care scriere umană și AI se suprapun cu adevărat.

Cum funcționează evidențierea la nivel de propoziție?

Câteva instrumente de detecție AI — inclusiv NotGPT — oferă evidențierea probabilității la nivel de propoziție alături de scorul la nivel de document, adnotând propoziții individuale cu estimarea locală a probabilității AI mai degrabă decât închizând totul într-un singur număr. Mecanismul tehnic funcționează prin calcularea perplexity independent pentru fiecare propoziție sau interval scurt, utilizând contextul înconjurător ca fundal pentru fiecare calcul local: propozițiile unde modelul ar atribui probabilitate înaltă fiecărui cuvânt apar într-un nivel AI ridicat, în timp ce propozițiile cu probabilitate mai mică prevăzută apar într-un nivel AI scăzut. Evidențierea la nivel de propoziție este practic utilă în două situații distincte. Pentru scriitori care efectuează o autoverificare pre-depunere, propozițiile evidențiate identifică ținte de revizuire specifice — pasaje în care scriere a derivat către un registru statistic asociat cu ieșire AI — înainte ca o depunere formală să fie marcată. Pentru instructori sau editori care revizuiesc un document marcat, distribuția de evidențiere arată dacă pasajele cu scor înalt se grupează într-o secțiune a documentului (ceea ce ar putea indica text care este stilistic inconsistent cu scriere înconjurătoare) sau se răspândesc uniform în tot documentul (ceea ce indică de obicei un model de stil de scriere mai degrabă decât utilizare selectivă a AI într-un pasaj specific).

De ce detectoarele ChatGPT dau fals pozitive?

Detectoarele ChatGPT dau fals pozitive atunci când textul scris uman împarte profilul statistic pe care clasificatorul îl asociază cu rezultatul AI — perplexity scăzut, burstiness scăzut — ceea ce se întâmplă mai des decât sugerează cererile de acuratețe ale producătorilor. Scriere formal constrânsă este cea mai frecventă cauză: scriere academică, juridică și tehnică se conformează convențiilor de gen care restricționează alegerile de vocabular, favorizează construcțiile pasive și impun organizare consecventă a paragrafului, toate acestea reducând atât perplexity, cât și burstiness chiar și atunci când textul este scris în întregime de om. Editarea este o a doua sursă de risc fals pozitiv ridicat — instrumente de corectare gramaticală care aplatizează variația neregulată a propoziției, sau treceri atente de revizuire care elimină formulări informale și tranzițiile greoaie, elimină caracteristicile cel mai statistic asociate cu autoria umană. Cercetarea condusă de la 2023 a documentat constant rate de fals pozitiv între 5 și 25 la sută în funcție de populația de scriitori și instrumentul utilizat, cu vorbitori de limba engleză non-nativi confruntând rate de două până la cinci ori mai mari decât vorbitorii nativi ai limbii engleze în sarcini identice. Aceste rate sunt substanțial mai mari decât raportează platformele pe referințiile lor interne curate, care de obicei compară rezultatul AI needit cu scriere umană informală — configurația care maximizează acuratețea clasificatorului și subreprezintă populațiile cel mai probabil să fie marcat fals în implementarea în lume reală.

Un scor înalt dintr-un detector ChatGPT este o clasificare statistică, nu o constatare a utilizării AI. Atunci când scriere umană și rezultat AI ocupă aceeași regiune a distribuției de probabilitate a unui clasificator, instrumentul nu le poate distinge — și unele scriere umană se află întotdeauna acolo.

Cum vă puteți autoverifica scriere înainte de depunere?

Odată ce înțelegeți cum funcționează detectoarele ChatGPT — măsurând perplexity și burstiness pentru a produce un scor de probabilitate — strategia de revizuire devine concretă mai degrabă decât abstractă. Trecerea textului dvs. prin instrument de detecție înainte de depunere formală vă oferă timp pentru a revizui pasaje marcate în timp ce mirajele sunt încă controlabile. Fluxul de lucru practic combină trei elemente: lipirea textului, citirea evidențierilor la nivel de propoziție pentru a identifica care pasaje specifice au obținut scor ridicat și revizuirea acestor secțiuni pentru a crește variația lungimii propoziției și specificitatea alegerii de cuvinte înainte ca documentul să intre într-un sistem instituțional sau editorial. Reviziile care reduc scorurile de detecție cel mai fiabil sunt aceleași care întăresc scriere în general — detalii specifice, vocabular precis și structuri de propoziții care reflectă gândire genuină mai degrabă decât cadru generic. Menținerea istoricului versiunilor și documentației de cercetare ca practică de rutină oferă, de asemenea, dovezi puternice în cazul în care o depunere este vreodată formal pusă la îndoială.

  1. Lipiți textul dvs. într-un instrument de detecție care oferă evidențiere a probabilității la nivel de propoziție, nu doar un scor general — datele la nivel de propoziție sunt locul în care se află direcțiile de revizuire actionabile
  2. Identificați propozițiile și paragrafele cu scor maxim; acestea sunt secțiunile în care profilul statistic al scriere dvs. se potrivește cel mai mult cu datele de antrenare generate de AI pe care clasificatorul le-a învățat
  3. În pasaje marcate, variați deliberat lungimea propoziției: după o propoziție complexă cu mai multe propoziții, plasați una scurtă și directă în același paragraf și căutați secvențe în care mai multe propoziții consecutive au lungime similară
  4. Înlocuiți vocabularul previzibil sau generic în secțiunile cu scor ridicat cu alegeri de cuvinte specifice și ancorat în context — exemple denumite, descrieri precise, observații în prima persoană pe care doar dvs. ați putea să le scrieți din contextul dvs. particular de cercetare
  5. Retreceti textul revizuit și comparați noul scor; scăderi substanțiale în secțiunile marcate anterior confirmă că burstiness și varietatea alegerii de cuvinte s-au îmbunătățit considerabil
  6. Salvați istoricul versiunilor de proiect, notele de cercetare și materialele sursă ca practică de rutină, astfel încât documentația procesului cu marcaj de timp este disponibilă în cazul în care o depunere este vreodată formal pusă la îndoială
  7. Pentru depuneri academice, executați autoverificarea pre-depunere cel puțin 48 de ore înainte de termen pentru a permite timp pentru revizuire semnificativă mai degrabă decât rescrituri de suprafață sub presiune

Detectează Conținut AI cu NotGPT

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

Detectează instantaneu text și imagini generate de AI. Umanizează-ți conținutul cu o singură atingere.

Articole Conexe

Capacități de Detectare

🔍

AI Text Detection

Lipiți orice text și primiți un scor de probabilitate de asemănare cu AI cu secțiuni evidențiate.

🖼️

Detectarea imaginilor AI

Încărcați o imagine pentru a detecta dacă a fost generată de instrumente AI cum ar fi DALL-E sau Midjourney.

✍️

Humanize

Rescrieți textul generat de AI pentru a suna natural. Alegeți intensitate Light, Medium sau Strong.

Cazuri de Utilizare