Skip to main content
ai-detectionguidewritingacademic-integrity

Ano ang Burstiness at Perplexity sa Pagsusulat? Ang Mga Signals sa Likod ng AI Detection

· 9 min read· NotGPT Team

Ano ang burstiness at perplexity sa pagsusulat — at bakit patuloy na lumilitaw ang dalawang statistical terms na ito sa bawat pagkakataon na sinasalita ang tungkol sa AI detection? Parehong concepts ay nagmula sa computational linguistics at information theory, ngunit pumasok sila sa mainstream conversation sa sandaling nagsimulang gamitin ng AI detectors ang mga ito bilang pangunahing ebidensya para sa kung ang isang piraso ng teksto ay isinulat ng isang tao o nabuo ng isang makina. Para sa mga estudyante, manunulat, at editor na ang kanilang gawa ay dumadaan sa automated screening, ang pag-unawa sa kung ano ang tunay na sinusukat ng mga signals na ito — at kung ano ang kanilang hindi — ay naaangkop sa bawat AI detection tool, hindi lamang sa isang tiyak na platform.

Ano ang Perplexity sa Pagsusulat?

Ang perplexity ay isang sukat na hiniram mula sa information theory, originally na ginagamit upang suriin kung gaano kalaki ang kalidad ng isang probability model sa pag-predict ng isang sample ng teksto. Sa konteksto ng language models at AI detection, ito ay kumukuha ng isang bagay na mas intuitive: kung gaano ka-surprised ang isang trained na language model sa sequence ng mga salita na pinili mo. Kapag ang pagpili ng salita ay lubhang predictable dahil sa mga salitang pumapalibot nito — ang malinaw na susunod na salita, ang inaasahang kasingkahulugan, ang conventional phrase na kumpleto sa isang pamilyar na pagbuo — ang modelo ay nagtatalaga ng mababang perplexity sa pagpipiliang iyon. Kapag ang manunulat ay umaabot para sa isang hindi pangkaraniwang kasingkahulugan, isang structurally na hindi inaasahang pangungusap, o isang idiosyncratic na pagliliko ng parirala, ang perplexity ay tumataas. Ang malalaking language models tulad ng ChatGPT, Claude, at Gemini ay sinanayan upang pumili ng pinakastatistically na malamang na susunod na salita sa bawat hakbang. Ang layunin sa pagsasanay na ito ay direktang nagreresulta sa mababang-perplexity na output — hindi bilang side effect kundi bilang fundamental consequence ng kung paano itinayo ang mga sistemang ito. Ang isang language model na nagsusulat ng paliwanag tungkol sa climate change ay pipiliin ang pinakamalamang na salita sa bawat hakbang, nanatiling nasa statistical path na susundan din ng anumang sinanayong modelo. Ang mga human writers, sa kabilang banda, ay gumagawa ng mga pagpipilian na hindi lubhang hinuhula ng training data: specific na mga metaphor, hindi pangkaraniwang ngunit tumpak na bokabularyo, mga sentence structure na sumasalamin sa inaasahang rhythm. Ang mga deviations na ito ay nagtutulak ng perplexity pataas, at ang mas mataas na perplexity text ay statistically na mas malamang na nanggaling sa isang tao.

Ang perplexity ay hindi sumusukat ng creativity o kalidad — ito ay sumusukat kung gaano kalayo ang isang piraso ng pagsusulat mula sa pinakastatistically na probable path. Ang mga human writers ay lumalayo nang higit pa kaysa sa language models, at ang gap na ito ay kung ano ang hinahanap ng AI detectors.

Ano ang Burstiness sa Pagsusulat?

Ang burstiness ay originally na naglarawan ng isang property ng time-series data at network events: ang tendency para sa ilang proseso na maglabas ng events sa clusters at gaps sa halip na sa steady, predictable rate. Kapag inilapat sa pagsusulat, ito ay naglalarawan ng variation sa sentence length, structural complexity, at stylistic register sa buong piraso ng teksto. Ang human writing ay naturally bursty. Ang isang essay, isang blog post, o isang reported article ay karaniwang pinagsasama ang maikling declarative sentences — direkta at matalino — kasama ang mas mahabang sentences na nagdadala ng subordinate clauses, embedded qualifications, at elaborated examples. Ang alternation na ito ay hindi consciously na pinaplano; ito ay sumasalamin sa rhythm ng spoken thought na naglalipat sa prose, ang paraan ng pagbabago ng emphasis naturally sa pagitan ng isang mabilis na punto at isang extended explanation. Ang AI-generated writing ay may tendency na mas mababa ang burstiness. Kapag ang isang language model ay bumubuo ng isang paragraph, hindi ito nakakaranas ng pagbabago sa register na nanggagaling sa paglipat sa pagitan ng isang emotional appeal at isang technical explanation, o mula sa pagsamahin ang isang key point sa isang sentence at palawakin ang implications nito para sa tatlong pahina pa. Ang resulta ay prose kung saan ang karamihan ng sentences ay umaabot sa isang katulad na structural weight: hindi identical, ngunit distributed na masyadong mas makitid kaysa dito karaniwang ginagawa ng isang human writer sa parehong word count. Ang burstiness ay sinusukat statistically sa buong dokumento, hindi sentence by sentence. Ang isang solong mahabang sentence ay hindi ginagawang bursty ang isang dokumento; kung ano ang mahalaga ay kung ang distribution ng sentence lengths sa buong teksto ay malawak o makitid.

  1. Narrow sentence-length distribution: kapag karamihan ng sentences sa isang passage ay nasa loob ng 10–15 word range, ang burstiness ay bumababa — kahit na ang individual sentences ay moderately long
  2. Uniform paragraph structure: mga paragraph na consistently na bumubukas ng topic sentence, nagdadagdag ng dalawa hanggang tatlong supporting sentences, at nagsasara ng transition ay sumusunod sa template na nagsusupress ng burstiness
  3. Consistent connective tissue: transitional phrases (however, therefore, additionally) na lumalitaw sa predictable structural positions ay lumilikha ng rhythm na kinikilala ng detection models bilang AI output
  4. Missing register shifts: ang human prose ay usually nagbabago ng tone at sentence weight sa pagitan ng narrative moments, analytical moments, at direct address — ang AI output ay may tendency na magpatuloy ng consistent register sa buong dokumento

Paano Ginagamit ng AI Detectors ang Dalawang Signals na Ito?

Ang karamihan ng AI detection tools — kasama ang Turnitin's AI Writing Indicator, GPTZero, at katulad na platforms — gumagamit ng perplexity at burstiness nang magkasama sa halip na trato-in ang bawat signal nang isolation. Ang kombinasyon ay lumilikha ng mas maaasahang classification dahil ang dalawang signals ay maaaring magpatunay o magkontra sa isa't isa sa mga paraan na nagkakaiba ang genuine edge cases mula sa malinaw na mga ito. Ang detection pipeline ay karaniwang gumagana sa sentence level na una. Bawat sentence ay sinusuri para sa kung gaano predictable ang word choices nito na ibinigay ang probability distribution ng isang language model — na gumagawa ng local perplexity score para sa sentence na iyon. Ang mga sentence-level scores na ito ay pagkatapos ay pinagsasama, at ang variance ng mga scores na ito sa buong dokumento — kung gaano consistent o inconsistently mataas o mababa ang mga ito — ay gumagawa ng burstiness signal. Ang isang dokumento kung saan ang sentence-level perplexity scores ay mas malapit na magkasama ay tumatanggap ng mababang score sa burstiness. Ang isang dokumento kung saan ang perplexity ay significantly na nag-iiba sa pagitan ng sentences ay tumatatanggap ng mas mataas. Kapag pareho ang mga signals ay tumutungo sa AI-generated text — mababang average perplexity at mababang variance sa sentences — ang detector ay nagtatalaga ng mataas na AI-probability score. Kapag ang mga signals ay conflicting — isang dokumento na may mababang average perplexity ngunit mataas na burstiness — ang classifier ay dapat gumawa ng mas uncertain na desisyon, na madalas na nagreresulta sa score sa gitna ng range kung saan walang confident na predicted na outcome.

  1. Sentence-level perplexity scoring: bawat sentence ay tumatanggap ng probability score batay sa kung gaano malamang ang sequence ng salita nito sa ilalim ng language model ng modelo
  2. Document-level burstiness calculation: ang variance ng sentence-level scores sa buong dokumento ay gumagawa ng burstiness measure
  3. Combined classification: ang mababang average perplexity na pinagsama sa mababang variance (burstiness) ay gumagawa ng pinakamataas na AI-probability scores
  4. Threshold application: ang proporsyon ng sentences na lumalampas sa classification threshold ay nagiging overall percentage score
  5. Score interpretation: hindi ang alinmang signal mag-isa ay bumubuo ng definitive finding — pareho ay nag-ambag ng probability, hindi certainty
Ang AI detectors ay hindi kumukumpara ng teksto mo laban sa isang database ng AI outputs. Sila ay sumusukat ng dalawang statistical properties ng iyong specific na teksto at kumukumpara ng mga property na iyon sa distributions na natutunan sa panahon ng training.

Bakit Ang AI Writing Ay Nakakakuha ng Napakabibigat na Pagkakaiba mula sa Human Writing?

Ang pag-unawa kung ano ang burstiness at perplexity sa pagsusulat ay nagiging mas concrete kapag sinusuri mo kung bakit ang AI-generated text ay reliably na tumatanggap ng mas mababa sa pareho kaysa sa karamihan ng human writing. Ang pagkakaiba ay bumalik sa training objective na lahat ng malalaking language models ay nagbabahagi: hula ng pinakamalamang na susunod na token na ibinigay ang nakapaligid na konteksto. Ang objective na ito ay kung ano ang ginagawang useful ang language models — ang mga ito ay naglalabas ng coherent, fluent, contextually appropriate text nang consistent. Ngunit ginagawa nito rin ang output na systematically na naiiba mula sa human writing sa measurable ways. Ang isang language model na bumubuo ng isang paragraph tungkol sa photosynthesis ay hindi nakakaranas ng fatigue, distraction, o ang impulse na magpasok ng isang unexpected analogy mula sa isang unrelated domain. Hindi ito may half-formed thought na gumagawa ng awkward run-on sentence bago ang writer ay bumalik upang patightin. Hindi ito gumagalaw mula sa formal explanation hanggang conversational aside dahil ang register ay naramdamang tama sa sandaling iyon. Sa halip, ito ay sumusunod sa statistical landscape ng training data, na gumagawa ng consistently probable choices sa bawat hakbang. Ang resulta ay prose na may recognizable texture: smooth, varied sapat upang maiwasan ang obvious repetition, ngunit nang walang sharp irregularities na nanggagaling sa real-time thinking na naglilipat sa teksto. Ang human writing, viewed statistically, ay mas messy — hindi dahil ang mga human writers ay mas kaunting skilled, ngunit dahil ang pagsusulat ay isang thinking process na tulad ng isang communication one, at ang pag-iisip sa sandaling iyon ay irregular. Ang isang paragraph na isinulat ng isang tao ay karaniwang nagpapakita ng variation sa word predictability habang ang writer ay umaabot para sa precision, gumagawa ng side observation, at bumalik sa main point. Ang variation na ito ay nagtutulak ng perplexity at burstiness pataas.

Ang AI text ay smooth dahil ang language models ay nag-optimize para sa smoothness. Ang human writing ay irregular dahil ito ay ginawa ng irregular thinking. Ang statistical difference sa pagitan ng dalawang processes na ito ay kung ano ang hina-train ng AI detection upang masukat.

Aling Mga Writing Patterns Ang Naglalabas ng Mababang Burstiness at Perplexity Scores?

Ang pinaka-practically na mahalaga insight mula sa pag-unawa kung ano ang burstiness at perplexity sa pagsusulat ay na ang mga human writers ay maaaring maglabas ng teksto na tumatanggap ng mababang score sa dalawang signals nang walang AI involvement. Ang maraming categories ng pagsusulat ay reliably na bumubuo ng statistical profiles na sumasalamin sa AI-generated output, na ginagawang mga common sources ng false positives sa lahat ng detection platforms. Ang pag-alam kung aling konteksto ang nagdadala ng risking na ito ay tumutulong sa mga writers, editors, at reviewers na i-interpret ang detection scores na may appropriate skepticism sa halip na treat ng isang solong numero bilang isang conclusyon.

  1. Formal academic register: ang conventions ng academic writing — clear topic sentences, structured arguments, formal vocabulary, logical transitions — ay naglalabas ng predictable, low-perplexity na prose, kahit na isinulat ng isang estudyante na master ng mga conventions na ito
  2. Technical at scientific writing: lab reports, methods sections, at technical documentation ay gumagamit ng narrow vocabulary domains at rigid structural templates na naghihigpit sa sentence variation at nagsusupress ng burstiness
  3. Non-native English writing: ang pagsusulat nang maingat sa isang pangalawang wika ay natural na naglalabas ng mas conservative, predictable vocabulary choices at mas uniform na sentence structures — nagrehistro bilang mababang perplexity at mababang burstiness kahit na entirely original
  4. Heavily edited final drafts: ang revision process ay nagpapakinis ng rough edges at tinatanggal ang idiosyncratic phrasing, na gumagalaw ng polished prose tungo sa statistical profile na kinikilala ng detection models bilang AI output
  5. Summarization at close paraphrase: ang teksto na sumusunod sa source document's structure ay madalas na nag-adopt ng source's statistical patterns; ang summaries ay may tendency tungo sa smooth, predictable prose kahit na bawat salita ay sa writer's sarili
  6. Short documents under 200 words: ang statistical models ay kailangan ng sufficient data upang maglabas ng reliable classifications; ang maikling texts ay naglalabas ng unstable scores na maaaring umugnay nang husto sa ilang word choices lamang
Ang isang false positive ay hindi ebidensya ng AI use — ito ay ebidensya na ang text's statistical profile ay nahulog sa overlapping region kung saan ang human at AI writing ay maaaring mamuhay. Ang mga rehiyong ito ay mas malaki kaysa karamihan ng detection vendors ay publicly na kinikilala.

Maaari Mo Bang Baguhin ang Iyong Perplexity at Burstiness Scores?

Kung alam mo kung paano tumatanggap ang iyong pagsusulat sa dalawang signals, maaari mong i-adjust ang specific surface-level features upang baguhin ang mga scores na ito — at ang mga adjustment ay tunay na pagpapabuti sa iyong prose, hindi tricks upang dayain ang algorithm. Ang mga pagbabago na nagpapataas ng burstiness at perplexity ay may tendency na gawing mas specific at mas readable ang pagsusulat, dahil sila ay nagpapalit ng generic patterns gamit ang particular choices. Ang pinakamatibay na lever para sa burstiness ay sentence-length variation. Kung sincan mo ang isang passage at makita na ang karamihan ng sentences ay nasa pagitan ng 15 at 22 words, mayroon kang mababang burstiness sa section na iyon. Deliberately na nagdadagdag ng ilang napakaikling sentences — lima hanggang siyam na words, na gumagawa ng isang punto nang direkta — at ilang mas mahabang sentences na may embedded qualifications ay nagbabago sa distribution. Ang isang ikling sentence na itinala pagkatapos ng dalawang medium-length na pangungusap ay measurably na nagbabago ng burstiness calculation para sa block na iyon. Para sa perplexity, ang pinakamatibay na lever ay specificity. Ang generic academic vocabulary — significant, important, various, multiple factors — ay lubhang predictable na ibinigay ang halos anumang konteksto at nag-drive ng perplexity pababa. Ang pagpalit ng generic adjective gamit ang isang precise na isa specific sa iyong argument ay nagpapataas ng local perplexity dahil ang pagpipilian ay mas kaunting inaasahan. Ang pagdaragdag ng isang concrete example na may specific na pangalan, numero, o observation ay gumagawa ng parehong epekto. Ang layunin ay hindi arbitrary variation — isang dokumento kung saan ang sentence lengths ay randomly na shuffled ay nabasa ng masama at maaaring hindi mapabuti ang perplexity sa lahat, dahil ang perplexity signal ay tumutugon sa word choices, hindi sentence order. Ang aim ay gawing mas concrete ang iyong pagsusulat at mas distinctively sa iyo, na mangyari ring naglalabas ng statistical profile na kinikilala ng detectors bilang human authorship.

  1. Scan bawat paragraph para sa sentence-length uniformity: markahan ang anumang block kung saan ang lahat ng sentences ay nasa loob ng 10-word range
  2. Sa mga block na ito, maglagay ng isang maikling direktang sentence sa ilalim ng 10 words pagkatapos ng mas mahabang isa, o hatiin ang isang 30-word sentence sa isang 12-word at isang 15-word sentence
  3. Palitan ang generic adjectives (significant, various, multiple) ng specific na mga ito na tunay na naglalarawan ng iyong argument — threefold increase, disputed, format-specific
  4. Magdagdag ng hindi bababa sa isang concrete example o specific observation sa bawat major section — ang mga ito ay nagpapataas ng local perplexity sa pamamagitan ng pagpapasok ng mga term na specific sa iyong konteksto sa halip na hinula mula sa topic ng paragraph
  5. Baguhin ang posisyon ng transitional phrases: hindi bawat paragraph ay kailangang magbukas ng However o Additionally — minsan ang contrast ay lumalabas mula sa sentence structure mismo
  6. Suriin ang quoted passages at citation blocks nang hiwalay: sila ay madalas na tumatanggap ng mababang score sa parehong signals at maaaring magdulot ng document's overall score; i-offset ang mga ito gamit ang iyong sariling analytical commentary bago at pagkatapos

Kung Ano Ang Burstiness at Perplexity Score Ay Tunay na Nagsasabi sa Iyo

Ang isang detection score base sa perplexity at burstiness ay isang statistical probability estimate, hindi isang determination ng authorship. Walang current AI detection system — hindi ang Turnitin's AI Writing Indicator, hindi ang GPTZero, hindi anumang platform na itinayo sa parehong underlying signals — ay maaaring tukuyin nang tumpak kung ang isang specific na tao ay nagsulat ng isang specific na piraso ng teksto, o kung ang isang specific na AI tool ay bumuo nito. Ang score ay kumakatawan sa kung nasaan ang text's statistical properties na mahulog na may kinalaman sa distribution na natuto ng detection model sa panahon ng training. Ang isang mataas na score ay nangangahulugan na ang text's perplexity at burstiness profile ay katulad ng teksto mula sa AI-generated side ng training distribution na iyon nang higit pa kaysa sa human-written side. Hindi ito nangangahulugang AI-generated ang teksto; nangangahulugan nito na ito ay statistically na katulad sa teksto na nangyari. Ang pinakaconcreteang ebidensya ng limitation na ito ay cross-platform disagreement. Ang parehong dokumento ay madalas na tumatanggap ng 75–85% AI sa isang platform at 25–35% AI sa isa pa. Kung pareho ang mga platforms ay sumusukat ng real, stable properties ng dokumento, ang mga numero na ito ay hindi dapat magkakaiba ng 50 percentage points. Ang disagreement ay sumasalamin sa differences sa training data, classification thresholds, at model architecture — hindi differences sa kung ano talaga ang teksto. Para sa practical purposes, kung ikaw ay isang estudyante na tumatanggap ng flagged result, isang editor na nagre-review ng submission, o isang instructor na nagde-decide kung paano i-interpret ang AI score, ang isang numero na derived mula sa perplexity at burstiness analysis ay isang data point sa marami — hindi isang verdict. Ang mga platforms tulad ng NotGPT ay nagpapakita kung aling specific na sentences ang nag-drive ng score, na nagbibigay-daan sa iyo na tuklasin ang flagged passages nang direkta sa halip na tumugon sa isang numero sa abstract.

Ang cross-platform variability ay ang clearest indicator na ang AI detection scores ay hindi sumusukat ng isang definitive tungkol sa isang dokumento. Kapag ang dalawang tools na itinayo sa parehong underlying signals ay magkakaiba ng 40 percentage points, walang score ay malakas na ebidensya sa sarili nitong karapatan.

Tukuyin ang AI Content gamit ang NotGPT

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

Agad na tukuyin ang AI-generated na teksto at mga larawan. I-humanize ang iyong nilalaman sa isang tap.

Mga Kaugnay na Artikulo

Mga Kakayahan sa Pagtuklas

🔍

AI Text Detection

I-paste ang anumang teksto at makatanggap ng isang AI-likeness probability score na may highlighted sections.

🖼️

AI Image Detection

I-upload ang isang larawan upang makilala kung ito ay nabuo ng AI tools tulad ng DALL-E o Midjourney.

✍️

Humanize

I-rewrite ang AI-generated text upang tumunog natural. Pumili ng Light, Medium, o Strong intensity.

Mga Kaso ng Paggamit