¿Cómo funciona un detector de IA? Un desglose técnico
¿Cómo funciona un detector de IA? La respuesta corta es que no lee el texto como lo haría un profesor o editor, sino que estudia la huella estadística que deja un modelo de lenguaje cuando genera palabras frente a cuando una persona escribe. Dos señales están en el centro de la mayoría de los detectores basados en texto: la perplejidad, que captura cuán predecibles son las opciones de palabras, y las ráfagas, que miden cuánto varía la estructura de las oraciones en un pasaje. Juntas, estas señales se introducen en un clasificador de aprendizaje automático entrenado que produce una estimación de probabilidad de autoría de IA en lugar de un simple veredicto de sí o no.
Tabla de Contenidos
- 01¿Cómo funciona un detector de IA a nivel de señal?
- 02¿Qué es la perplejidad y cómo revela la escritura de IA?
- 03¿Qué son las ráfagas y por qué importan para la detección?
- 04¿Cómo impulsan los clasificadores de aprendizaje automático los detectores de IA?
- 05¿Qué muestra realmente el resaltado a nivel de oración?
- 06¿Por qué los detectores de IA generan falsos positivos?
- 07¿Cuáles son los casos más difíciles para la detección actual de IA?
- 08¿Cómo funciona un detector de IA cuando lo usa en su propio texto?
¿Cómo funciona un detector de IA a nivel de señal?
Los detectores de IA no verifican la gramática, no evalúan la calidad de los argumentos ni buscan plagio en el sentido tradicional. Analizan las propiedades estadísticas del texto: los patrones de probabilidad que emergen cuando un modelo de lenguaje encadena palabras frente a cuando una persona escribe naturalmente. El mecanismo central es una asimetría: los modelos de lenguaje eligen el token más probable dado el contexto, lo que produce una salida fluida que también es, por definición, estadísticamente predecible para otro modelo que la evalúe después. Los escritores humanos no optimizan para la probabilidad de token. Elegimos palabras por ritmo, énfasis, personalidad y registro: opciones que a menudo parecen sorprendentes desde un punto de vista puramente probabilístico, incluso cuando son perfectamente claras y legibles. Más allá de las dos métricas fundamentales de perplejidad y ráfagas, muchos detectores también introducen características adicionales (diversidad de vocabulario, frecuencia de voz pasiva, densidad de frases de transición) en un clasificador de aprendizaje automático entrenado. La combinación de estas señales permite que el detector devuelva una puntuación de probabilidad en lugar de una etiqueta binaria, que es una representación más honesta de lo que la detección estadística realmente puede decirle.
¿Qué es la perplejidad y cómo revela la escritura de IA?
La perplejidad es una medida tomada de la teoría de la información que captura cuán sorprendido estaría un modelo de lenguaje por una secuencia de palabras dada. Cuando una IA genera texto, selecciona consistentemente tokens de alta probabilidad, por lo que otro modelo que evalúa la salida después ve exactamente lo que habría predicho, lo que resulta en puntuaciones de perplejidad bajas. Los escritores humanos no siguen la ruta del token más probable. Una persona podría usar una palabra inusual para efecto, romper una estructura de oración inesperadamente, o elegir una formulación que refleje su voz en lugar de lo que un modelo clasificaría como la opción más probable. Estas decisiones estilísticas producen perplejidad más alta: el texto es más sorprendente desde el punto de vista probabilístico, aunque se lee claramente para una audiencia humana. Los detectores de IA utilizan esta asimetría directamente: los pasajes donde cada transición de palabra es estadísticamente esperada tienden a puntuarse como similares a IA, mientras que los pasajes con fraseología inesperada, quiebres estructurales o uso de palabras idiosincrásico tienden a puntuarse más cerca de lo humano. La complicación es que no toda la escritura humana tiene alta perplejidad. Los géneros formales (documentos legales, trabajos académicos, informes clínicos) utilizan construcciones predecibles porque esos registros lo exigen. Una cláusula estándar de modelo y una versión generada por GPT de esa misma cláusula pueden parecer casi idénticas bajo análisis de perplejidad, por lo que la perplejidad sola no es un veredicto confiable en dominios especializados.
La perplejidad mide cuán predecibles son las opciones de palabras relativas a lo que un modelo de lenguaje esperaría. El texto generado por IA tiende a ser estadísticamente poco sorprendente; la escritura humana introduce opciones que no siguen la ruta del token más probable.
¿Qué son las ráfagas y por qué importan para la detección?
Las ráfagas capturan algo diferente de la perplejidad: la variación en la estructura y la longitud de las oraciones en un pasaje. La escritura humana es típicamente rápida. Un escritor podría seguir una oración larga y compleja cargada de cláusulas subordinadas con una corta y directa. El énfasis cambia. El ritmo se acelera y se ralentiza dependiendo de lo que haga el pasaje. Esta irregularidad no es accidental: refleja cómo los humanos piensan a través de ideas en la página, alternando entre elaboración y resumen, entre complejidad y claridad. El texto generado por IA tiende a tener ráfagas bajas. Los modelos de lenguaje optimizan para la coherencia, lo que produce prosa donde las oraciones se agrupan alrededor de una longitud y complejidad estructural similares. El resultado se lee sin problemas pero parece inusualmente uniforme cuando se examina la distribución de longitud de oración en un pasaje completo. Un histograma de longitudes de oración en una salida típica de GPT a menudo muestra un grupo apretado alrededor de una media; el mismo análisis en texto escrito por humanos tiende a mostrar una distribución más amplia. Los detectores calculan las ráfagas analizando la varianza de la longitud de la oración, las distribuciones de complejidad sintáctica y las medidas estructurales relacionadas en todo el texto. Como la perplejidad, las ráfagas son una señal probabilística en lugar de un marcador definitivo. Algunos escritores académicos entrenados producen prosa de ráfagas deliberadamente bajas en registros formales. Y un modelo de IA bien instruido puede generar texto con ráfagas más altas si se le indica explícitamente que varíe la longitud de la oración. La señal es más significativa en pasajes largos donde hay suficientes oraciones para establecer una distribución, no en fragmentos cortos de algunos cientos de palabras.
¿Cómo impulsan los clasificadores de aprendizaje automático los detectores de IA?
La perplejidad y las ráfagas son métricas estadísticas que se pueden calcular desde primeros principios. Lo que convierte esas métricas en un detector práctico es un clasificador de aprendizaje automático entrenado en grandes conjuntos de datos de texto etiquetado: pasajes confirmados como escritos por humanos frente a generados por IA. El clasificador aprende qué combinaciones de señales son más predictivas de la autoría de IA, y puede pesar docenas de características simultáneamente en lugar de confiar solo en dos números. Las características comunes más allá de la perplejidad y las ráfagas incluyen proporciones de riqueza de vocabulario (cuán diversas son las opciones de palabras en un pasaje), frecuencia de voz pasiva, la densidad de frases transicionales específicas, patrones de estructura a nivel de párrafo y puntuaciones de coherencia semántica entre oraciones adyacentes. La calidad de los datos de entrenamiento determina casi todo sobre el rendimiento de un clasificador en la práctica. Un modelo entrenado principalmente en salida de GPT-3.5 ha aprendido las huellas estadísticas de ese modelo específico. Puede funcionar bien en texto de GPT-3.5 sin editar pero tiene un rendimiento deficiente en Claude 3 Sonnet, Gemini o GPT-4o, que tienen diferentes firmas de estilo. Esto crea un retraso en los datos de entrenamiento: siempre que se lanza y se adopta ampliamente un nuevo modelo de lenguaje importante, los detectores entrenados antes de que estuviera disponible necesitan tiempo y nuevos ejemplos etiquetados para calibrarse contra él. Algunos proveedores de detectores lanzan actualizaciones regulares para rastrear esta divergencia; otros no mantienen activamente sus clasificadores después del lanzamiento. La edad y amplitud de los datos de entrenamiento de un detector importan tanto como la sofisticación de su arquitectura: ambos factores determinan cuán bien generaliza más allá de sus condiciones de referencia originales.
¿Qué muestra realmente el resaltado a nivel de oración?
La mayoría de los detectores de IA modernos no devuelven solo una puntuación agregada única: también resaltan oraciones o párrafos individuales que contribuyeron más al resultado general. Cada sección resaltada lleva una puntuación de probabilidad local: la estimación del clasificador de que este pasaje específico parece generado por IA según sus propiedades estadísticas. Estas puntuaciones locales se agregan luego, generalmente con alguna ponderación, en el número de nivel de documento que se muestra en la parte superior. El resultado a nivel de oración es útil precisamente porque le dice dónde se concentra la señal, no solo cuán fuerte es la señal en general. Una puntuación de nivel de documento del 70% similar a IA significa algo muy diferente dependiendo de si el contenido señalado se agrupa en unos pocos párrafos consecutivos o se dispersa por todo el documento. La señalización concentrada en una sección puede sugerir que el contenido se redactó por separado, o que un pasaje particular utiliza un registro que el clasificador puntuó como similar a IA. La señalización distribuida en todo el documento sugiere una línea de base más consistente que afecta el estilo general del autor. El resaltado a nivel de oración también ayuda a diagnosticar falsos positivos. Cuando un pasaje está señalado pero sabe que es su propia escritura, mirar qué oraciones específicas están resaltadas y por qué podrían parecer similares a la IA le da mucho más con lo que trabajar que solo un número agregado. Una oración introductoria formal, un pasaje con pocas variaciones de estilo o una sección que utiliza terminología técnica pueden activar puntuaciones locales más altas sin participación de IA.
¿Por qué los detectores de IA generan falsos positivos?
Los falsos positivos (donde un detector marca texto escrito por humanos como generado por IA) no son casos límite raros. Son una consecuencia predecible de la detección estadística aplicada a escritura que comparte propiedades de superficie con la salida de IA, y ocurren con suficiente regularidad para importar en cualquier contexto donde las consecuencias reales siguen a la puntuación. El activador más común es la superposición de estilo: texto escrito en un estilo formalmente correcto, estructuralmente uniforme, vocabulario restringido, incluso aunque el autor sea humano. Los hablantes de inglés no nativos que trabajan cuidadosamente en un registro formal tienen un riesgo consistentemente mayor. Cuando alguien estructura intencionalmente las oraciones para minimizar los errores gramaticales (precisamente porque el inglés no es su primer idioma), el texto resultante puede parecer de baja perplejidad y baja ráfaga para un detector, coincidiendo estrechamente con el perfil que asocia con salida generada por IA. La escritura técnica, legal y clínica presenta un problema similar. Estos géneros hacen cumplir las transiciones predecibles, rangos de vocabulario restringido y estructuras estandarizadas por convención profesional, independientemente de quién las escribió. El texto estándar específico del dominio (lenguaje de garantía estándar, cláusulas de contrato recurrentes, plantillas de informes de diagnóstico) obtiene rutinariamente puntuaciones altas en detectores de IA incluso aunque el autor sea humano. Los textos cortos por debajo de aproximadamente 250 palabras son otra fuente consistente de falsos positivos: la mayoría de los detectores simplemente no tienen suficientes datos estadísticos en una muestra corta para producir clasificaciones confiables. La variación aleatoria en un fragmento corto puede empujar una puntuación que se vea humana por encima de un umbral de marcado. La implicación práctica es que una puntuación de detección alta y una identificación confirmada de autoría de IA no son lo mismo: distinguir entre ellas requiere mirar el contexto, el historial de escritura y los pasajes específicos que impulsaron el resultado.
Los falsos positivos son una consecuencia predecible de la detección de IA estadística aplicada a escritura que comparte propiedades de superficie con la salida de IA, no casos límite raros, sino un modo de fallo conocido en categorías de texto específicas y bien definidas.
¿Cuáles son los casos más difíciles para la detección actual de IA?
Algunos tipos de texto se encuentran en una zona donde los detectores de IA luchan consistentemente, independientemente de qué plataforma utilice. Saber cómo se ven esos casos con anticipación ayuda a calibrar cuánto peso poner en los resultados de detección. Los borradores de IA fuertemente editados son el ejemplo más claro. Si alguien usa GPT para un primer borrador y luego lo reescribe sustancialmente (cambiando vocabulario, reestructurando oraciones, insertando sus propios ejemplos y análisis), la huella estadística original se diluye hasta el punto donde la mayoría de los detectores devuelven puntuaciones no confiables. Incluso la edición moderada puede empujar una puntuación del 85% de IA a menos del 50% sin ningún cambio fundamental en la autoría. Los documentos mixtos, donde algunas secciones están escritas por humanos y otras son generadas por IA, crean problemas de agregación. Un documento que es 60% humano y 40% IA puede producir una puntuación agregada que se vea sin remarcar, mientras que el desglose a nivel de oración revela un patrón más claro de dónde originó cada sección. El contenido altamente técnico o especializado también crea dificultades. Cuando un dominio hace cumplir el vocabulario restringido y la estructura predecible por convención profesional, un detector no puede distinguir de manera confiable entre generación de IA y escritura humana experta en ese estilo: la señal de perplejidad es especialmente débil aquí porque la prosa orientada a la precisión es de baja perplejidad por diseño. Finalmente, la salida de IA con ingeniería de indicaciones (texto generado con instrucciones explícitas para variar la longitud de la oración, introducir fraseología informal y evitar patrones comunes de IA) puede obtener puntuaciones engañosamente bajas en la mayoría de los detectores. Esta es una dinámica de carrera armamentista que ningún enfoque de detección puede evadir completamente: a medida que las personas aprenden qué miden los detectores, pueden instruir a las herramientas de IA para evitar esos patrones específicos.
- Borradores de IA fuertemente editados: la edición posterior diluye la huella estadística en la que se basan los detectores
- Documentos humano-IA mixtos: las puntuaciones agregadas pueden ser engañosas; el resultado a nivel de oración es esencial
- Escritores de inglés no nativo: la escritura formal y cuidadosa produce patrones estadísticos similares a IA sin participación de IA
- Textos cortos por debajo de 250 palabras: datos insuficientes para clasificación confiable
- Prosa técnica o legal específica del dominio: las convenciones profesionales crean patrones de superficie similares a IA en escritura humana
- Salida de IA con ingeniería de indicaciones: texto generado con instrucciones para evitar patrones de detección requiere señales más sofisticadas para capturar
¿Cómo funciona un detector de IA cuando lo usa en su propio texto?
Conocer la mecánica técnica detrás de la detección de IA es más útil cuando observa resultados para algo que realmente escribió (o está evaluando algo que le fue presentado). Cuando pega texto en un detector y recibe una puntuación, la herramienta está ejecutando todas estas señales simultáneamente: calculando perplejidad en todo el pasaje, midiendo ráfagas en longitud y estructura de oraciones, alimentando esos valores junto con características adicionales en un clasificador entrenado, y devolviendo tanto una puntuación agregada como un desglose a nivel de oración. La puntuación agregada le dice la estimación general de probabilidad; el desglose a nivel de oración le dice qué pasajes específicos lo impulsaron. Para los escritores que revisan su propio trabajo, la parte procesable suele ser la vista a nivel de oración. Si algunos pasajes específicos se resaltan mientras el resto del texto no, esa es una señal significativa que vale la pena investigar: ya sea que esos pasajes se redactaron de manera diferente, o que simplemente utilizan un estilo que el clasificador califica como similar a la IA (transiciones formales, vocabulario restringido, variación de longitud de oración baja). La detección de texto de NotGPT devuelve tanto la puntuación de probabilidad a nivel de documento como las oraciones individuales resaltadas, por lo que puede rastrear exactamente qué secciones contribuyeron al resultado en lugar de trabajar hacia atrás desde un solo porcentaje. Para cualquiera que reciba una puntuación inesperadamente alta en su propia escritura, la vista a nivel de oración es el punto de partida más útil para comprender a qué está respondiendo el detector y si el resultado refleja su autoría real o un falso positivo.
Detecta Contenido de IA con NotGPT
AI Detected
“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”
Looks Human
“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”
Detecta al instante texto e imágenes generados por IA. Humaniza tu contenido con un toque.
Artículos Relacionados
¿Qué son las ráfagas y la perplejidad en la escritura? Una guía en lenguaje simple
Una explicación más profunda de las dos señales estadísticas centrales en las que se construyen la mayoría de los detectores de texto de IA.
¿Funcionan los detectores de IA? Una mirada realista a la precisión y los límites
Un desglose honesto de las tasas de precisión del detector de IA, patrones de fallas del mundo real y lo que los números realmente significan.
Falsos positivos de detección de IA: por qué los detectores marcan la escritura humana
Una mirada detallada a las condiciones específicas que causan que los detectores de IA clasifiquen erróneamente el texto escrito por humanos como generado por IA.
Capacidades de Detección
Detección de texto de IA
Pegue cualquier texto y reciba una puntuación de probabilidad de similitud de IA con secciones resaltadas.
Detección de imágenes de IA
Cargue una imagen para detectar si fue generada por herramientas de IA como DALL-E o Midjourney.
Humanizar
Reescriba texto generado por IA para que suene natural. Elija entre intensidad ligera, media o fuerte.
Casos de Uso
Educadores revisando envíos de estudiantes por integridad académica
Cómo los maestros usan detectores de IA como herramienta de detección para marcar envíos que justifiquen una conversación más cercana.
Escritores revisando su propio texto antes de enviar
Qué hacer cuando un detector califica su propia escritura como probable de IA y cómo interpretar el desglose a nivel de oración.
Editores revisando grandes volúmenes de contenido enviado
Usar la detección de IA como filtro de primera pasada para equipos editoriales que manejan artículos contribuidos a escala.