Skip to main content
ai-detectionguideexplainer

Bagaimana Cara Kerja Detektor ChatGPT? Penjelasan dalam Bahasa Sederhana

· 10 min read· NotGPT Team

Memahami cara kerja detektor ChatGPT sangat berguna untuk siswa yang mengirimkan makalah, editor yang menyaring konten freelancer, dan instruktur yang menghadapi pekerjaan yang ditandai dan perlu menilai apakah skor tersebut mewakili bukti yang bermakna atau kebisingan statistik. Alat-alat ini adalah pengklasifikasi pembelajaran mesin yang mengukur dua sinyal utama dalam teks — perplexity dan burstiness — dan menghasilkan estimasi probabilitas bahwa bagian tersebut dihasilkan oleh model bahasa daripada ditulis oleh manusia. Skor bukan putusan, dan celah antara hasil dan kesimpulan yang dapat diandalkan adalah tempat paling banyak kesalahpahaman tentang sistem ini cenderung terjadi.

Bagaimana Detektor ChatGPT Bekerja pada Tingkat Statistik?

Bagaimana cara kerja detektor ChatGPT pada tingkat paling mendasar? Mereka mengurangi pertanyaan tentang penulisan menjadi masalah statistik, membandingkan properti terukur teks tertentu dengan apa yang dipelajari pengklasifikasi dari sampel besar teks yang ditulis manusia dan teks yang dihasilkan AI. Detektor ChatGPT adalah pengklasifikasi pembelajaran mesin yang dilatih pada koleksi besar teks yang ditulis manusia dan teks yang dihasilkan AI dari model termasuk GPT-4, Claude, Gemini, dan Llama. Selama pelatihan, pengklasifikasi mempelajari properti statistik mana yang membedakan dua kategori — terutama seberapa dapat diprediksi setiap pilihan kata mengingat konteksnya, dan seberapa konsisten panjang kalimat dan struktur tetap konsisten di seluruh dokumen. Pada waktu inferensi, alat menerima teks input, mengekstrak fitur-fitur tersebut, dan menampilkan angka antara 0 dan 100 yang mewakili seberapa dekat profil statistik teks cocok dengan apa yang dipelajari model dari sampel pelatihan yang dihasilkan AI. Dua pendekatan teknis utama ada: model pengklasifikasi yang disempurnakan yang melewatkan input melalui transformer dan membaca representasi lapisan akhir, serta detektor berbasis watermark yang memeriksa tanda tangan statistik yang tertanam dalam token pada waktu pembuatan. Sebagian besar alat menghadap konsumen — GPTZero, Copyleaks, fitur deteksi AI Turnitin, dan NotGPT — menggunakan pendekatan pengklasifikasi yang disempurnakan, karena deteksi watermark memerlukan kerjasama dari sistem yang menghasilkan dan tidak bekerja pada teks dari model apa pun yang tidak menanamkan tanda tangan selama pembuatan.

Apa Itu Perplexity dan Mengapa Itu Penting?

Perplexity adalah ukuran seberapa terkejut model bahasa akan menjadi oleh setiap kata dalam bagian, mengingat kata-kata sebelumnya. Ketika model AI menghasilkan teks, ia memilih token yang paling mungkin secara statistik pada setiap posisi — menghasilkan prosa yang, menurut desain, memiliki perplexity rendah relatif terhadap distribusi pelatihan model. Penulis manusia tidak mengoptimalkan untuk probabilitas token: mereka mencari frasa yang tidak biasa, beralih register di tengah-paragraf, dan membuat pilihan kata yang sesuai dengan suara pribadi mereka daripada opsi yang paling aman secara statistik, menghasilkan perplexity agregat yang lebih tinggi daripada output yang dihasilkan AI pada topik yang sama. Detektor ChatGPT memanfaatkan asimetri ini dengan menjalankan input melalui model bahasa referensi, mengumpulkan probabilitas log yang diberikan pada setiap token, dan mengagregasikannya menjadi satu skor. Perplexity agregat rendah meningkatkan estimasi kemungkinan AI; perplexity tinggi menunjukkan pilihan kata yang akan mengejutkan model bahasa, yang merupakan sinyal yang terkait dengan penulisan manusia. Komplikasinya adalah bahwa kategori tertentu dari penulisan manusia — dokumentasi teknis, prosa akademik formal, konten yang disunting dengan cermat — juga mencetak perplexity rendah karena mereka mengandalkan kosakata terbatas dan konvensi genre, yang merupakan tempat asal false positives.

Perplexity mengukur seberapa dapat diprediksi setiap pilihan kata mengingat konteksnya. Teks yang dihasilkan AI hampir sesuai konstruksi memiliki perplexity rendah — model memilih token berikutnya yang paling mungkin pada setiap langkah, dan dapat diprediksi inilah yang dilatih detektor untuk menemukan.

Apa Itu Burstiness dan Bagaimana Detektor Menggunakannya?

Burstiness menangkap variasi dalam panjang kalimat dan kompleksitas struktural di seluruh dokumen. Penulis manusia secara alami menghasilkan teks dengan burstiness tinggi: paragraf mungkin dibuka dengan pengamatan pendek dan langsung, diikuti dengan kalimat panjang yang berlapis kualifikasi dan konteks, kemudian ditutup dengan pernyataan berukuran sedang yang mendorong argumen maju. Variasi ini bukan pilihan gaya yang disengaja — ini adalah hasil sampingan dari bagaimana pemikiran manusia menghasilkan penulisan, mengikuti momentum kognitif dan tekanan kontekstual daripada target optimasi kelancaran. Model AI cenderung menghasilkan teks dengan burstiness rendah karena mereka mengoptimalkan untuk output yang halus dan dapat dibaca di setiap langkah token, menghasilkan kalimat yang berkumpul dalam rentang panjang yang konsisten dan mengikuti pola struktural yang dapat diprediksi di seluruh paragraf. Detektor menghitung burstiness dengan mengukur varians statistik dalam distribusi panjang kalimat di seluruh dokumen: varians rendah meningkatkan estimasi probabilitas AI, sementara varians tinggi — terutama campuran kalimat yang sangat pendek dan panjang di bagian yang sama — adalah sinyal yang kuat menuju penulisan manusia. Ini adalah alasan mengapa dengan sengaja mencampur panjang kalimat di bagian yang ditandai cenderung mengurangi skor deteksi: itu mengembalikan sinyal burstiness yang tidak dimiliki output AI yang konsisten.

Model AI mengoptimalkan untuk kelancaran satu token pada satu waktu, menghasilkan output yang konsisten secara ritmis sebagai efek samping. Penulis manusia mengikuti alur pemikiran mereka, dan variasi yang dihasilkan dalam panjang kalimat adalah sinyal burstiness yang diukur detektor.

Bagaimana Detektor Menghasilkan Skor Kepercayaan?

Output dari sebagian besar detektor ChatGPT adalah persentase — diberi label probabilitas AI, kepercayaan yang dihasilkan AI, atau deskriptor serupa. Angka ini adalah estimasi pengklasifikasi bahwa teks termasuk dalam kelas yang dihasilkan AI, berdasarkan kombinasi yang diukur dari perplexity, burstiness, dan fitur tambahan apa pun yang model spesifik dilatih. Hasil 80 persen AI tidak berarti detektor 80 persen yakin tentang seluruh dokumen: ini berarti fitur teks berada pada persentil ke-80 dari distribusi kemungkinan AI yang dipelajari pengklasifikasi selama pelatihan, yang merupakan klaim yang berbeda dan lebih kompleks secara interpretatif. Sebagian besar platform menerapkan ambang batas — biasanya 60 hingga 80 persen — di atas mana hasil dilaporkan sebagai kemungkinan besar dihasilkan AI, tetapi ambang batas spesifik mempengaruhi false positive dan true positive rates dalam arah yang berlawanan: ambang batas lebih rendah menangkap lebih banyak konten AI tetapi menandai lebih banyak tulisan manusia; ambang batas lebih tinggi mengurangi alarm palsu dengan mengorbankan kehilangan lebih banyak teks yang dihasilkan AI. Variabilitas skor di seluruh platform adalah salah satu sinyal paling praktis tentang keandalan: dokumen yang mencetak 78 persen pada satu detektor dan 42 persen pada detektor lain tidak berada di wilayah di mana klasifikasi alat mana pun harus diperlakukan sebagai definitif, karena teks menempati zona statistik di mana penulisan manusia dan AI benar-benar tumpang tindih.

Bagaimana Cara Kerja Penyorotan Tingkat Kalimat?

Beberapa alat deteksi AI — termasuk NotGPT — menyediakan penyorotan probabilitas tingkat kalimat bersama skor tingkat dokumen, memberikan anotasi pada kalimat individual dengan estimasi kemungkinan AI lokal mereka daripada meruntuhkan semuanya menjadi satu angka. Mekanisme teknis bekerja dengan menghitung perplexity secara independen untuk setiap kalimat atau rentang pendek, menggunakan konteks sekitar sebagai latar belakang untuk setiap perhitungan lokal: kalimat di mana model akan menetapkan probabilitas tinggi untuk setiap kata muncul dalam tingkat AI yang tinggi, sementara kalimat dengan probabilitas yang diprediksi lebih rendah muncul dalam tingkat AI yang rendah. Penyorotan tingkat kalimat secara praktis berguna dalam dua situasi yang berbeda. Untuk penulis yang melakukan pemeriksaan pra-pengajuan mandiri, kalimat yang disorot mengidentifikasi target revisi khusus — bagian di mana tulisan telah bergeser ke register statistik yang terkait dengan output AI — sebelum pengajuan formal ditandai. Untuk instruktur atau editor yang meninjau dokumen yang ditandai, distribusi sorotan menunjukkan apakah bagian yang mencetak tinggi berkumpul di satu bagian dokumen (yang mungkin menunjukkan teks yang tidak konsisten secara gaya dengan tulisan sekitar) atau tersebar merata di seluruh dokumen (yang biasanya menunjukkan pola gaya penulisan daripada penggunaan AI selektif di bagian spesifik).

Mengapa Detektor ChatGPT Memberikan False Positives?

Detektor ChatGPT memberikan false positives ketika teks yang ditulis manusia berbagi profil statistik yang terkait pengklasifikasi dengan output AI — perplexity rendah, burstiness rendah — yang terjadi lebih sering daripada klaim akurasi vendor sarankan. Penulisan yang dibatasi secara formal adalah penyebab paling umum: akademik, hukum, dan penulisan teknis mengikuti konvensi genre yang membatasi pilihan kosakata, mendukung konstruksi pasif, dan menegakkan organisasi paragraf yang konsisten, semuanya mengurangi perplexity dan burstiness bahkan ketika teksnya sepenuhnya ditulis manusia. Penyuntingan adalah sumber kedua dari peningkatan risiko false positive — alat koreksi tata bahasa yang meratakan variasi kalimat yang tidak teratur, atau laluan revisi yang cermat yang menghilangkan frasa informal dan transisi canggung, menghilangkan fitur yang paling banyak terkait secara statistik dengan penulisan manusia. Penelitian yang dilakukan sejak 2023 secara konsisten telah mendokumentasikan tingkat false positive antara 5 dan 25 persen tergantung pada populasi penulisan dan alat yang digunakan, dengan penutur bahasa Inggris bukan asli menghadapi tingkat dua hingga lima kali lebih tinggi daripada penutur asli bahasa Inggris pada tugas identik. Tingkat ini secara substansial lebih tinggi daripada apa yang dilaporkan platform pada benchmark internal mereka yang dikurasi, yang biasanya membandingkan output AI yang tidak disunting dengan tulisan manusia informal — konfigurasi yang memaksimalkan akurasi pengklasifikasi dan merepresentasikan kurang populasi yang paling mungkin ditandai secara palsu dalam penerapan nyata.

Skor tinggi dari detektor ChatGPT adalah klasifikasi statistik, bukan temuan penggunaan AI. Ketika teks manusia dan output AI menempati wilayah yang sama dalam distribusi probabilitas pengklasifikasi, alat tidak dapat membedakan di antara mereka — dan beberapa tulisan manusia selalu melakukannya.

Bagaimana Anda Dapat Memeriksa Tulisan Anda Sebelum Pengajuan?

Setelah Anda memahami cara kerja detektor ChatGPT — mengukur perplexity dan burstiness untuk menghasilkan skor probabilitas — strategi revisi menjadi konkret daripada abstrak. Menjalankan teks Anda sendiri melalui alat deteksi sebelum pengajuan formal memberi Anda waktu untuk merevisi bagian yang ditandai sementara taruhannya masih dapat dikelola. Alur kerja praktis menggabungkan tiga elemen: menempelkan teks, membaca sorotan tingkat kalimat untuk mengidentifikasi bagian spesifik mana yang mencetak tinggi, dan merevisi bagian-bagian tersebut untuk meningkatkan variasi panjang kalimat dan spesifisitas pilihan kata sebelum dokumen memasuki sistem institusional atau editorial. Revisi yang mengurangi skor deteksi paling andal adalah revisi yang sama yang memperkuat tulisan secara umum — detail spesifik, kosakata presisi, dan struktur kalimat yang mencerminkan pemikiran asli daripada kerangka kerja generik. Menyimpan riwayat versi dan dokumentasi penelitian sebagai praktik rutin juga memberikan bukti tandingan yang kuat jika pengajuan pernah secara formal ditantang.

  1. Tempel teks Anda ke dalam alat deteksi yang menyediakan sorotan probabilitas tingkat kalimat, bukan hanya skor keseluruhan — data tingkat kalimat adalah tempat pedoman revisi yang dapat ditindaklanjuti berada
  2. Identifikasi kalimat dan paragraf dengan skor tertinggi; ini adalah bagian di mana profil statistik tulisan Anda paling sesuai dengan data pelatihan yang dihasilkan AI yang dipelajari pengklasifikasi dari
  3. Di bagian yang ditandai, variasikan panjang kalimat dengan sengaja: ikuti kalimat multi-klause kompleks dengan yang pendek dan langsung di paragraf yang sama, dan cari urutan di mana beberapa kalimat berturut-turut serupa dalam panjang
  4. Ganti kosakata yang dapat diprediksi atau generik di bagian dengan skor tinggi dengan pilihan kata spesifik dan berakar secara kontekstual — contoh bernama, deskripsi presisi, pengamatan orang pertama yang hanya Anda yang bisa tulis dari konteks penelitian spesifik Anda
  5. Jalankan kembali teks yang direvisi dan bandingkan skor baru; penurunan substansial di bagian yang sebelumnya ditandai mengkonfirmasi bahwa burstiness dan keragaman pilihan kata telah meningkat secara terukur
  6. Simpan riwayat draf, catatan penelitian, dan bahan sumber Anda sebagai praktik rutin sehingga dokumentasi proses dengan stempel waktu tersedia jika pengajuan pernah ditanyakan secara formal
  7. Untuk pengajuan akademik, jalankan pemeriksaan pra-pengajuan mandiri setidaknya 48 jam sebelum tenggat waktu untuk memungkinkan waktu untuk revisi bermakna daripada penulisan ulang tingkat permukaan di bawah tekanan

Deteksi Konten AI dengan NotGPT

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

Deteksi teks dan gambar yang dihasilkan AI secara instan. Humanisasi konten Anda dengan satu ketukan.

Artikel Terkait

Kemampuan Deteksi

🔍

Deteksi Teks AI

Tempel teks apa pun dan terima skor probabilitas kemiripan AI dengan bagian yang disorot.

🖼️

Deteksi Gambar AI

Unggah gambar untuk mendeteksi apakah itu dihasilkan oleh alat AI seperti DALL-E atau Midjourney.

✍️

Humanize

Tulis ulang teks yang dihasilkan AI agar terdengar alami. Pilih intensitas Ringan, Sedang, atau Kuat.

Kasus Penggunaan