Turnitin 能检测到 ChatGPT 吗?学生和教师需要了解的内容
Turnitin 能检测到 ChatGPT 吗?简短的答案是能。Turnitin 在 2023 年 4 月推出了 AI Writing Indicator,该工具现在在大多数已选择加入的教育机构账户中处于活跃状态。该系统的工作方式与抄袭检查不同;它不会将文本与 ChatGPT 输出数据库进行匹配。相反,它查看往往能将 AI 生成的散文与人类写作分开的统计写作模式。理解检测器实际测量的内容——以及它的不足之处——有助于学生更负责任地写作,也有助于教师解读报告,而不是将单一百分比视为证据。
目录
2025 年 Turnitin 能检测到 ChatGPT 吗?
能,Turnitin 在 2025 年能够检测到 ChatGPT,该系统自推出以来一直在逐步改进。AI Writing Indicator 与抄袭相似度评分是分开的。它以百分比形式出现,反映提交文档中有多大可能是由 AI 生成的,并有句级别的亮点显示哪些段落推高了评分。Turnitin 声称其模型是在数十亿份人类撰写和 AI 生成的文档上训练的,特别关注 GPT-3.5 和 GPT-4 输出——这意味着 ChatGPT 文本是该系统校准所针对的最常见信号之一。对于询问提交 ChatGPT 草稿是否会被忽视的学生,现实的答案是较长的、编辑较少的 ChatGPT 输出经常被标记。非常短的段落、大量修改过的文本或从较长 AI 草稿中提取的单个段落更难可靠地评分。检测对 300 字或更长的提交效果最好。
Turnitin 的 AI Writing Indicator 如何工作?
Turnitin 使用困惑度和突发性分析的组合来评估文本。困惑度衡量在给定前面单词的情况下每个单词的可预测性。AI 语言模型(包括 ChatGPT)选择统计上可能的单词——这产生低困惑度、流畅的文本,很少令语言模型的预测感到惊讶。相比之下,人类写作往往包含更多出乎意料的词汇选择、个人参考和文体变化。突发性衡量句子长度和复杂性的变化。人类写作倾向于混合短而有力的句子和更长、更复杂的句子。ChatGPT 通常会产生统一的句子结构,尤其是在生成没有特定格式说明的正式论文回复时。Turnitin 通过专有分类器处理这些信号,返回置信度评分。评分不是二进制的。35% 的读数意味着大约三分之一的提交字数显示了强烈的 AI 模式信号;90% 的读数意味着几乎所有的都是。Turnitin 明确反对使用低阈值作为提交的自动证明。
Turnitin 不称其输出为保证。它称之为指标——这是教师审查的起点,而不是替代品。
Turnitin 检测 ChatGPT 的准确性如何?
Turnitin 报告假阳性率低于 1% 的声称完整文档 100% 是 AI 生成的,但这个数字的含义没有听起来那么窄。一份 80% 是 AI 生成的文档仍然可能收到一个评分,该评分会促使进行对话,而不会触发自动处罚。实际上,准确性取决于多个变量。大量编辑过的 ChatGPT 输出的评分往往低于原始输出,因为编辑引入了人类的变异。非英语使用者的写作可能会得分高于预期,因为形式正确的语法加上可预测的句子节奏有时会类似于 AI 输出模式。同一段落提交两次可能会获得略有不同的评分,具体取决于使用的 Turnitin 模型版本。来自 2023 年和 2024 年的独立研究发现,Turnitin 的 AI 检测器在原始 ChatGPT 论文上表现良好,但在文本被改写、重组或与真正的人类段落合并时会减弱。只提交 ChatGPT 输出而不进行修改的学生面临最高的检测风险。主要自己写作并使用 ChatGPT 进行小幅措辞协助的学生面临更低但仍然非零的假阳性风险。
Turnitin 会标记已编辑过的 ChatGPT 输出吗?
Turnitin 是否能检测到编辑后的 ChatGPT 取决于文本的修改程度。轻微编辑——更正几个单词、改变引言、添加句子——很少会降低评分到足以有关系的程度。AI 文本的统计指纹分布在整个段落中,而不是集中在单个单词上。大量编辑——重组段落、替换被动结构、添加具体示例、插入个人分析——确实会大幅降低评分,因为这些更改引入了真正的人类写作模式。改写工具呈现特定情况。自动改写工具通常保留 AI 生成文本的基础结构,同时交换词汇。Turnitin 的研究表明,其模型捕捉幸存词汇替换的结构信号,因此改写过的 ChatGPT 草稿仍然经常得分高于促使教师注意的阈值。更清洁的方法是使用 AI 输出作为大纲或事实参考来源,然后自己编写实际提交。这种使用方式不会留下与提交编辑过的 ChatGPT 散文相同的统计足迹。
Turnitin 上多少分数应该让学生担心?
Turnitin 没有设置通用的及格或不及格阈值。这个决定由每个教育机构和个别教师做出。一些学校将任何高于 20% 的评分视为进行审查对话的理由。其他学校直到提交达到 60% 或更高时才会提出关注。一种常见的教师立场是将 20% 以下的评分视为无关紧要,将 50% 以上的评分视为需要解释,这两个数字之间的范围根据具体情况进行处理。学生很少直接看到 AI Writing Indicator 评分,除非他们的教育机构启用了学生面向的报告。即使在可见的情况下,单独的评分也不能决定结果。教师通常会审查哪些句子被标记,将标记的文本与学生之前的工作或课堂写作进行比较,并可能在得出任何结论前要求进行对话。一篇十页文章的 30% 评分(其他方面与先前的提交一致)的读法可能会与来自错过所有办公时间的学生的首次提交的 30% 评分不同。
Turnitin 的 ChatGPT 检测能否出错?
能。假阳性是有文献记载的,它们往往聚集在特定的写作情况中。高度公式化的流派——求职信、具有标准方法部分的实验室报告、法律备忘录、技术规范——通常按惯例使用可预测的句子结构,而不是由于 AI 参与。学过通过结构化教科书的正式学术措辞的非英语使用者有时会产生评分高于用相同论点但更随意方式写作的英语使用者的文本。ESL 和 EFL 学生是在 AI 检测的学术文献中最常引用的假阳性群体。Turnitin 承认这一限制,并建议教师不要在没有额外背景的情况下将评分视为结论性的。收到假阳性的学生应该保存其写作过程的证据:笔记、草稿、研究注释或显示源阅读的浏览器历史记录。这种文档对教师的说服力远大于来自另一个检测器的任何反对评分。
- 在整个写作过程中在 Google Docs 或其他版本跟踪编辑器中保存带时间戳的草稿。
- 保持研究笔记和带注释的来源,以显示特定主张背后的证据。
- 记下你的草稿的哪些部分在不同时间写成——如果被询问,这有助于重建你的过程。
- 不要删除早期的草稿,即使是粗略的,直到作业评分后且任何上诉期限已过。
如何在提交到 Turnitin 前检查你的写作?
通过外部 AI 检测器运行提前提交检查不能保证你的 Turnitin 评分,但它可以帮助你识别读起来过于通用的段落,并在官方报告存在前促使修改。最有用的方法是将完整的草稿——不是一次一个段落——粘贴到提供句级反馈的检测器中。被多个工具标记或在不同检测模型中一致标记的段落是最值得修改的。这里的修改意味着添加具体的证据、命名的来源或你自己的推理——而不仅仅是重排单词。如果一个段落总结了一个一般概念而没有任何特定的主张或示例,那通常是检测器标记的内容,也通常是论文中最薄弱的写作,无论检测如何。
- 粘贴完整的草稿,而不仅仅是可疑的段落,以获得代表性的评分。
- 查看哪些特定的句子被标记,而不仅仅是整体百分比。
- 通过添加命名的来源、具体示例或你自己的分析句子来修改标记的部分。
- 在修改后运行第二次检查以确认模式已改变。
- 保留原始草稿和修改版本以记录你的过程。
NotGPT 如何融入提前提交工作流程?
NotGPT 是一个移动 AI 检测器,分析文本的 AI 相似性并提供概率评分和句级亮点。它不是 Turnitin 的替代品——它使用自己的检测模型,无法访问机构工作流、LMS 上下文或教师的政策。它提供的是当你想在提交前快速检查草稿时的方便第二意见。句级亮点帮助识别哪些特定段落读起来在统计上是可预测的,因此你知道在哪里集中修改工作。Humanize 功能可以为标记的段落建议改写,尽管目标应该是清晰度和具体性,而不仅仅是降低评分。对于学生而言,当无法方便地访问桌面并需要从电话检查草稿时,NotGPT 很有用。对于教师而言,当 Turnitin 报告标记了提交而你想在开始与学生对话前查看不同的模型是否同意时,它可以作为交叉参考。应该将其视为补充背景,而不是任何学术决定的基础。
使用NotGPT检测AI内容
AI Detected
“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”
Looks Human
“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”
即时检测AI生成的文本和图像。一键将内容人性化。
相关文章
检测功能
AI Text Detection
粘贴任何文本并接收带有高亮部分的 AI 相似概率评分。
AI Image Detection
上传图像以检测它是否由 DALL-E 或 Midjourney 等 AI 工具生成。
Humanize
重写 AI 生成的文本使其听起来自然。选择 Light、Medium 或 Strong 强度。