Skip to main content
ai-detectionturnitinchatgptacademic-integrity

Como o Turnitin detecta ChatGPT? Dentro do indicador de escrita por IA

· 10 min read· NotGPT Team

Como o Turnitin detecta ChatGPT — e mais amplamente, como ele distingue o texto gerado por IA de qualquer coisa que um aluno tenha escrito? A resposta curta é que o indicador de escrita por IA do Turnitin não procura impressões digitais de ferramentas de IA específicas; em vez disso, ele mede duas propriedades estatísticas do texto chamadas perplexidade e variabilidade que tendem a diferir entre escritores humanos e grandes modelos de linguagem. Entender essa distinção é importante para os alunos, porque uma pontuação alta não prova que o ChatGPT foi usado — indica que certas passagens compartilham características estatísticas com prosa gerada por IA, que às vezes também podem aparecer na escrita humana comum.

Como o Turnitin detecta ChatGPT?

A maioria dos alunos que perguntam como o Turnitin detecta o ChatGPT fica surpresa ao descobrir que o sistema não mantém um banco de dados de impressões digitais de saídas de IA. Não há uma biblioteca armazenada de respostas do ChatGPT sendo comparadas com seu ensaio — o indicador de escrita por IA analisa as propriedades estatísticas de qualquer texto na sua frente, sem referência a nenhum sistema de IA específico. Os dois sinais que o Turnitin mede principalmente são perplexidade e variabilidade. A perplexidade captura o quão previsível é cada escolha de palavra dado o contexto circundante. Modelos de linguagem como ChatGPT são treinados para selecionar a palavra seguinte mais provável, o que torna sua saída consistentemente baixa em perplexidade — flui suavemente e fica perto do caminho esperado. Escritores humanos buscam sinônimos inesperados, tomam decisões de fraseologia idiossincrásica e às vezes estruturam frases de maneiras que quebram o padrão antecipado. A variabilidade mede quanto o comprimento das frases e a complexidade estrutural variam em um documento. A prosa humana naturalmente alterna entre frases curtas e diretas e construções mais longas e elaboradas. ChatGPT e ferramentas similares tendem a produzir frases de comprimento e complexidade mais uniformes em toda uma resposta dada. Quando ambos os sinais apontam na mesma direção — perplexidade baixa e variabilidade baixa — o indicador de escrita por IA atribui uma probabilidade mais alta de que o texto foi gerado por máquina.

  1. Análise de perplexidade: avalia o quão previsível é cada escolha de palavra dado o contexto circundante
  2. Análise de variabilidade: mede quanto o comprimento das frases e a complexidade estrutural variam em todo o documento
  3. Classificação em nível de sentença: cada frase recebe uma pontuação de probabilidade para a autoria por IA
  4. Percentual agregado: a proporção de sentenças que cruzam o limite de classificação torna-se a pontuação geral
  5. Nenhuma identificação de ferramenta: o modelo não pode determinar se ChatGPT, Claude, Gemini ou outra ferramenta foi usada
O indicador de escrita por IA do Turnitin mede a textura estatística do texto — não qual IA o produziu, mas se o texto soa como algo que uma IA teria escrito.

O que é o indicador de escrita por IA e quando foi lançado?

O Turnitin lançou seu indicador de escrita por IA em abril de 2023, inicialmente como um recurso no Turnitin Feedback Studio. A ferramenta foi construída internamente usando o conjunto de dados de texto acadêmico proprietário do Turnitin — um dos maiores repositórios de redações de alunos acumulados em mais de duas décadas de detecção de plágio. Esse conjunto de dados deu à equipe de pesquisa do Turnitin uma vantagem significativa: um modelo calibrado especificamente para gêneros de escrita acadêmica em vez de conteúdo geral da Internet. Quando um instrutor ativa a detecção de IA para uma tarefa, cada envio acima do limite mínimo de palavras é processado automaticamente através do indicador de escrita por IA juntamente com a verificação de similaridade padrão. As duas análises são independentes. Um envio pode receber uma pontuação alta em originalidade — indicando nenhum plágio — e simultaneamente mostrar uma porcentagem de IA alta, porque a detecção de plágio procura por texto copiado de fontes conhecidas, enquanto a detecção de IA mede propriedades estatísticas do texto enviado em si. O modelo do Turnitin foi projetado para prosa acadêmica em inglês e funciona com menos confiabilidade em documentos com menos de 300 palavras, envios principalmente em outros idiomas ou textos contendo grandes blocos de material citado.

"O indicador de escrita por IA foi construído no conjunto de dados de redação acadêmica mais extenso do mundo — um que reflete como os alunos realmente escrevem, não apenas como a IA gera texto." — Turnitin, 2023

O Turnitin detecta toda a saída do ChatGPT?

A questão de como o Turnitin detecta o ChatGPT vem com uma qualificação importante: a resposta depende muito de quanto a saída da IA foi modificada antes do envio. O indicador de escrita por IA do Turnitin é eficaz na detecção de saída do ChatGPT em sua forma bruta — texto copiado diretamente de uma resposta do ChatGPT e colado em um envio sem modificação. Nestes casos, a assinatura estatística da saída do ChatGPT permanece em grande parte intacta, e o modelo normalmente atribui uma porcentagem de IA alta. A detecção se torna menos confiável quando o texto foi substancialmente modificado após a geração. Parafraseando um rascunho do ChatGPT — reescrevendo frases, alterando vocabulário, reestruturando parágrafos — altera as propriedades estatísticas do texto de maneiras que reduzem o sinal de IA. Quanto mais completamente um aluno edita a saída do ChatGPT, mais os padrões de perplexidade e variabilidade se deslocam para os da escrita humana, e menos confiante o modelo pode ser. As ferramentas de humanização de IA criam um desafio semelhante: são especificamente projetadas para produzir saída que se assemelha aos padrões estilísticos humanos, e podem reduzir significativamente as pontuações de IA em vários sistemas de detecção. O Turnitin reconheceu que texto muito modificado e humanizado apresenta um desafio técnico genuíno e afirmou que o modelo de detecção é atualizado regularmente conforme essas ferramentas evoluem. A lacuna entre a saída bruta de IA e o conteúdo de IA amplamente editado é real, e nenhum detector de IA atual — incluindo o do Turnitin — fecha completamente.

Uma resposta do ChatGPT colada diretamente em um ensaio carrega uma assinatura estatística clara. A mesma resposta após edição e reescrita completas pode carregar muito menos uma.

O que significa uma pontuação alta de IA do Turnitin para os alunos?

Uma pontuação alta do indicador de escrita por IA do Turnitin significa que uma proporção significativa de frases no envio correspondia ao perfil estatístico que o modelo associa ao texto gerado por IA. Não prova que ChatGPT ou qualquer outra ferramenta foi usada — é um sinal de probabilidade, não uma conclusão definitiva de má conduta. As próprias orientações do Turnitin recomendam tratar qualquer pontuação, independentemente da porcentagem, como o início de uma conversa em vez de um julgamento final. A maioria das instituições definiu limites internos que determinam quando uma pontuação de IA se torna acionável. Documentos com pontuação abaixo de 20% são geralmente tratados como baixo risco pela política institucional, porque a confiança do modelo nesse nível é insuficiente para tirar conclusões significativas. Pontuações entre 20% e 40% são comumente sinalizadas para revisão do instrutor sem desencadear procedimentos formais de integridade acadêmica. Pontuações acima de 40% podem, dependendo da política institucional, levar a um processo de revisão formal — embora isso varie consideravelmente entre universidades e até entre departamentos dentro da mesma instituição. A coisa mais útil a saber como aluno é que a pontuação chega ao seu instrutor em um visualizador de documentos que também mostra quais frases específicas foram sinalizadas. Um instrutor observando uma pontuação de 45% que vê que as frases sinalizadas são todas de uma conclusão formalmente escrita tirará conclusões muito diferentes de alguém que vê passagens sinalizadas espalhadas por todas as seções do artigo.

  1. Abaixo de 20%: normalmente tratado como inconclusivo pela maioria das políticas institucionais
  2. 20%–40%: frequentemente sinalizado para conversa instrutor-aluno sem procedimentos formais
  3. Acima de 40%: pode desencadear uma revisão formal de integridade acadêmica sob algumas políticas institucionais
  4. A porcentagem reflete a proporção de frases sinalizadas, não um nível de confiança geral para o documento
  5. Revise a política de integridade acadêmica de sua instituição para os limites exatos que se aplicam a você

O Turnitin pode dizer qual ferramenta de IA você usou?

Esta é uma das clarificações mais importantes sobre como a detecção do Turnitin funciona: o indicador de escrita por IA não pode identificar se ChatGPT, Claude, Gemini, Copilot ou qualquer outra ferramenta específica gerou o texto em questão. O modelo mede as propriedades estatísticas do texto enviado em si — não compara o texto com um banco de dados de saídas de sistemas de IA conhecidos. Isso significa que um envio será pontuado de forma semelhante, independentemente de qual ferramenta de IA o produziu, contanto que os padrões estatísticos no texto se assemelhem à prosa gerada por IA. Também significa que o modelo não pode ser usado para descartar o uso de IA com base em qual ferramenta um aluno afirma ter usado. Uma pontuação alta se aplica igualmente se o texto veio de GPT-4o, Gemini 1.5 ou um modelo menor — e uma pontuação baixa não confirma autoria humana mais do que uma pontuação alta confirma autoria por IA. A incapacidade de atribuir texto a uma ferramenta específica não é uma falha exclusiva do Turnitin. Todos os sistemas de detecção de IA atuais funcionam medindo propriedades estilísticas e estatísticas do texto, não reconhecendo a saída de sistemas particulares. Isso os torna amplamente aplicáveis na paisagem de IA, mas também significa que não podem servir como evidência forense conclusiva em nenhum caso individual de integridade acadêmica.

"Nenhum detector de IA atual pode identificar com confiabilidade qual ferramenta de IA gerou um determinado trecho de texto — eles podem apenas relatar o quão estatisticamente similar o texto é à prosa gerada por IA em geral."

Por que o Turnitin às vezes marca a escrita humana?

O indicador de escrita por IA do Turnitin produz falsos positivos — casos em que texto escrito por humanos recebe uma pontuação alta de IA — por várias razões bem documentadas. Compreender esses padrões ajuda os alunos a contextualizar suas pontuações e ajuda os instrutores a evitar tirar conclusões firmes de apenas uma porcentagem. A prosa acadêmica formal é a fonte mais comum de falsos positivos. Alunos que dominaram as convenções da escrita acadêmica — frases de tópicos claros, estrutura lógica de parágrafos, transições formais, vocabulário restrito — produzem texto que se assemelha muito ao que grandes modelos de linguagem geram. Isso é em parte porque os modelos de IA foram treinados em grandes quantidades desse tipo de escrita, e em parte porque as próprias convenções de escrita acadêmica produzem prosa previsível e de baixa variabilidade. Falantes não nativos de inglês são afetados desproporcionalmente. Escrever em uma segunda língua tende para escolhas gramaticais mais seguras e previsíveis — menos fraseologia idiossincrásica e menos seleções de palavras inesperadas — que se registram como perplexidade baixa mesmo quando a escrita é completamente original. Rascunhos muito polidos e editados são outro gatilho comum: o processo de revisão naturalmente suaviza a variação áspera em um primeiro rascunho, movendo o texto final para estruturas de frases mais uniformes. Gêneros de escrita técnica — relatórios de laboratório, resumos de casos, análises comerciais estruturadas — impõem modelos de formato que produzem baixa variação estilística por design, e frequentemente pontuam mais alto em indicadores de IA do que prosa narrativa ou argumentativa do mesmo escritor.

  1. Registro acadêmico altamente formal produz perplexidade baixa, um padrão também característico de saída de IA
  2. Escrita não nativa em inglês tende para escolhas de vocabulário previsíveis que reduzem a variabilidade
  3. Rascunhos finais muito polidos e editados são mais suaves e uniformes do que rascunhos não revisados
  4. Formatos de escrita técnica (relatórios de laboratório, estudos de caso, análises estruturadas) impõem modelos de baixa variação
  5. Envios com menos de 300 palavras produzem resultados estatisticamente não confiáveis independentemente da autoria
  6. Blocos de citações densas de fontes acadêmicas formais podem carregar padrões estatísticos semelhantes ao de IA
Um falso positivo não é uma falha do sistema — é uma característica da detecção estatística. Qualquer modelo que classifique por padrão em vez de origem ocasionalmente classificará escrita humana que acontece de seguir padrões similares.

O que você deve fazer antes de enviar para o Turnitin?

Depois de entender como o Turnitin detecta o ChatGPT, o próximo passo prático é tomar algumas ações proativas antes de enviar tarefas em que a detecção de IA está ativada. A ação mais útil é executar seu rascunho através de um detector de IA independente antes que o Turnitin o processe. Ferramentas como NotGPT fornecem destaque em nível de frase que mostra quais passagens específicas têm mais probabilidade de serem sinalizadas — dando-lhe tempo para revisar antes do prazo em vez de explicar uma pontuação depois. Uma pré-verificação é especialmente valiosa se você escreve em um registro acadêmico formal, está enviando em seu segundo idioma ou está produzindo conteúdo técnico estruturado. Se você revisar passagens sinalizadas para introduzir mais variação natural — substituindo transições formulaicas por callbacks mais específicos ao seu argumento, adicionando exemplos concretos, variando o comprimento das frases com mais intencionalidade — o texto resultante tanto lê melhor quanto é menos provável que desencadeie uma pontuação alta quando o Turnitin executa sua análise. Para passagens que permanecem com alta pontuação após revisão manual, o recurso Humanize do NotGPT ajusta a fraseologia em intensidade Leve, Média ou Forte para restaurar a variação estilística que distingue a prosa natural. Além das ferramentas de detecção, manter um processo de escrita documentado é o hábito de longo prazo mais confiável. Salvar rascunhos datados, manter notas de pesquisa e preservar seus esboços significa que se um envio receber uma pontuação alta, você tem evidência concreta de seu processo para compartilhar com seu instrutor — que é a resposta mais eficaz a qualquer sinalização de detecção de IA.

  1. Conclua seu rascunho e faça uma leitura completa antes de verificar padrões de IA
  2. Cole o texto completo na detecção de texto IA do NotGPT e revise o destaque em nível de frase
  3. Identifique passagens sinalizadas como prováveis geradas por IA e observe seus padrões estruturais
  4. Revise seções sinalizadas: varie o comprimento das frases, adicione detalhes específicos, substitua transições genéricas
  5. Use o recurso Humanize do NotGPT para passagens que permanecem com alta pontuação após revisão manual
  6. Salve todas as versões de rascunhos e quaisquer esboços, notas ou documentos de pesquisa que você usou
  7. Envie para o Turnitin antes do seu prazo com uma imagem clara de como seu documento provavelmente será pontuado
"Pré-verificação é a mesma disciplina que revisão de provas. Você não está tentando enganar o sistema — está garantindo que sua escrita autêntica soe como você."

Detecte Conteúdo AI com NotGPT

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

Detecte instantaneamente texto e imagens gerados por IA. Humanize seu conteúdo com um toque.

Artigos Relacionados

Capacidades de Detecção

🔍

Detecção de texto por IA

Cole qualquer texto e receba uma pontuação de probabilidade de semelhança de IA com seções destacadas.

🖼️

Detecção de imagem por IA

Faça upload de uma imagem para detectar se foi gerada por ferramentas de IA como DALL-E ou Midjourney.

✍️

Humanize

Reescreva o texto gerado por IA para soar natural. Escolha intensidade Leve, Média ou Forte.

Casos de Uso