Skip to main content
turnitinai-detectionacademic-integrity

Turnitin 检测 AI 还是检测抄袭?两者都有,单独进行

· 10 min read· NotGPT Team

学生经常想知道 Turnitin 是否检测 AI 还是只检测抄袭,简短的答案是两者都有——但通过两个独立运行并产生单独结果的不同系统。相似度报告已经存在数十年,将提交的文本与网页、期刊和之前提交的论文数据库进行比较。AI 写作指示器是一项较新的功能,使用统计模型来估计段落被大型语言模型生成的可能性。理解这种差异很重要,因为一份报告中的低分数对另一份报告没有任何说明,将任何一个数字作为不当行为的确定证据对待是学生和教师都应该避免的错误。

Turnitin 的相似度报告实际上测量的是什么?

相似度报告是 Turnitin 的原始产品。它将提交的文本与包括数十亿网页、学术期刊文章、学生论文档案和书籍的数据库进行比较。当段落与数据库中已有的内容匹配时,Turnitin 会突出显示重叠部分并列出来源。总体相似度百分比就是提交内容与数据库中某些内容匹配的比例。高相似度分数不会自动意味着学生抄袭了。正确引用和标注的文本仍然会出现在报告中。常见短语、技术术语、标准定义和复制到提交文件中的作业说明都会增加计数。预期教师会打开来源列表并评估被标记的匹配是真正的抄袭还是合法的重叠。一篇编辑良好、引用充分的论文可能显示 30% 的相似度分数而没有任何问题,而一篇分数为 5% 的论文仍然可能包含虚构的来源或未引用的改写。

Turnitin 何时添加的 AI 检测?

Turnitin 在 2023 年 4 月推出了其 AI 写作检测功能,以应对 OpenAI 在 2022 年底公开发布模型后 ChatGPT 在学术写作中的广泛使用。AI 写作指示器使用与相似度报告不同的方法。与其将文本与已知来源数据库进行匹配,它分析写作本身的统计模式。GPT-4 等模型生成的文本具有相对可预测的词序列,因为它们为每个下一个标记分配概率。人类写作往往不太可预测,在句子结构和词汇方面变化更大。Turnitin 的模型经过训练以区分这些模式,输出是一个百分比,表示提交内容中有多少似乎是由 AI 生成的。机构必须单独启用 AI 指示器。并非每所学校或每位教师都启用了它,这就是为什么有些学生只看到相似度报告。

Turnitin 的 AI 指示器在 2023 年 4 月作为相似度报告的单独产品推出,机构必须选择加入才能激活它。

相似度报告和 AI 指示器是同一回事吗?

不,它们通过不同的方法测量完全不同的东西。相似度报告向外看:它将提交的文本与数据库中现有的来源进行比较。AI 指示器向内看:它分析写作的统计结构来估计语言模型是否生成了它。学生可能有低相似度分数和高 AI 分数,这意味着写作看起来是原创的,但读起来像是模型生成的。相反的情况也很常见:紧密遵循教科书或指定阅读的论文在相似度上分数可能很高,但在 AI 指示器上分数很低,因为学生进行了大量阅读并用自己的语言进行了释义。两份报告需要单独的解释。当有人问 Turnitin 是检测 AI 还是只检测抄袭时,正确的框架是 Turnitin 两者都检测,但来自每个系统的证据适用于不同的问题。

文档能否在两份报告上都得到高分?

可以,但这种组合的含义与任何单一分数都不同。相似度分数高和 AI 分数高的文档可能表明学生使用 AI 生成了段落,然后在没有引用的情况下插入它们,从而与模型在训练期间看到的来源产生了匹配。相似度高但 AI 低的文档会指向传统复制或过度引用。相似度低但 AI 高是大多数学生最担心的情况:听起来原创但实际上是 AI 生成的文章。两项分数都低的文档就是典型的编辑良好、引用充分的论文的样子。这些组合都不是最终判决。例如,高 AI 分数并不排除学生自己写了这段话而检测器产生了假阳性的可能性。Turnitin 自己的指导指出,AI 指示器并非设计为学术诚信决定的唯一依据。

为什么 AI 分数不是不当行为的证据?

AI 分数是概率估计,不是法医事实。Turnitin 以 20% 检测阈值为目标的假阳性率为 1%,这意味着每 100 篇真正由人类撰写的论文中,大约 1 篇仍可能被标记。在句子级别,误差幅度会增加。多种写作模式对完全由人类撰写的作品产生了较高的 AI 分数。正式的学术风格,采用被动语态、非人称语气和有纪律的过渡,可能类似于模型生成的文章。仔细遵循语法规则和避免成语的非英语使用者可能会看到较高的分数。技术摘要中的简短陈述句也可能触发指示器。商业、法律和科学领域中的模板繁重的写作对统计模型来说通常看起来像 AI 输出。这并不意味着指示器无用;这意味着分数应被视为开启对话的一个数据点,而不是结束对话的证据。负责任地使用它的教师会询问学生关于作业流程、审查早期草稿并将作品与其他写作样本进行比较。

AI 写作指示器旨在帮助开启对话,而不是作为学术不当行为的最终判决。

学生应如何应对高 AI 分数?

高 AI 分数令人压力大,但这与指控不同。最有用的回应是在需要之前记录您的写作过程。保留您的浏览器研究选项卡、大纲草稿、Google 文档或 Word 中的修订历史记录、讲座笔记以及提交前编写的任何草稿。这些材料可以表明论文在一段时间内通过您自己的思考而发展。如果您从教师那里收到关注,请冷静回应并愿意解释您的过程。描述您咨询的来源、您开发的论点以及您对结构和措辞所做的选择。如果关注在正式程序中进一步升级,请询问是否存在上诉途径以及证据标准是否需要不仅仅是 AI 分数。大多数学术诚信政策包括要求有意义证据和有机会回应的程序。

  1. 在提交前保存研究笔记、大纲和所有草稿版本。
  2. 使用 Google 文档或 Word 中的版本历史记录来显示您的论文如何发展。
  3. 如果被标记,请要求进行对话,而不是等待正式指控。
  4. 询问学校政策是否要求将 AI 分数与其他证据结合起来。
  5. 保留您的来源和您在写作过程中收到的任何反馈的记录。

当两项功能都激活时,Turnitin 检测 AI 还是只检测抄袭?

当一个机构同时启用了相似度报告和 AI 写作指示器时,Turnitin 对同一提交文件运行两项检查,并将它们呈现为报告的单独部分。教师看到带有来源引用的相似度百分比和带有句子级突出显示的 AI 百分比。AI 报告中的句子突出显示显示了模型认为论文哪些部分最有可能是 AI 生成的,而相似度突出显示显示了哪些部分与特定来源匹配。这两个突出显示层是独立的。在两份报告中都被突出显示的句子需要两个单独的解释。这个组合视图中的 AI 分数不会影响相似度分数,也不会根据另一个调整任何报告。所以当人们问 Turnitin 检测 AI 还是只检测抄袭时,在完全启用的设置中的实际答案是两项检查同时运行,但产生教师必须独立评估的单独、非重叠的证据。

学生在提交前可以做什么来降低风险?

通过外部工具运行提前提交检查可以让学生粗略了解他们的写作在正式报告存在之前对 AI 检测模型的读法。这些工具与 Turnitin 不同,无法预测其确切输出,但可以标记看起来在统计上流畅或通用的段落。如果外部工具标记了一个段落,请阅读它并问自己它是否提出了由命名来源支持的具体主张,句子结构是否有变化,以及它听起来像是您的推理还是像任何人都可以写的总结。朝着具体性和语音方向修改比改写来欺骗模型更有生产力。对于相似度检查,标准引用实践处理了大部分风险。在使用精确短语时直接引用,对所有其他内容用自己的话释义,并引用您查阅的每一个来源会使相似度分数易于解释。目标不是低分数;目标是相似度报告中的每个匹配都可以解释为合法的。

  1. 运行外部 AI 检测检查以查找过度流畅或通用的段落。
  2. 将标记的段落修改为具体主张、命名来源和您自己的推理。
  3. 审查您的引用以确保每个释义的观点都附有来源。
  4. 将您的最终草稿与您的大纲进行比较,以检查您的论点是否仍然存在。
  5. 如果您在任何时候使用了 AI 工具,请在提交前遵循学校的披露政策。

NotGPT 在这幅图中的位置

NotGPT 是一个移动 AI 检测工具,用于检查文本的 AI 相似度和图像的 AI 生成。它不是抄袭检查器,也不能复制 Turnitin 的相似度数据库。它在这种情况下的作用是提前提交阅读辅助。学生可以将草稿粘贴到应用程序中,查看哪些段落在 AI 概率标度上得分很高,然后决定这些段落是否需要修改。Humanize 功能提供了重写读起来过于通用的段落的方法,尽管更好的用法是添加具体的具体细节,而不是掩盖风格。对于教育工作者,NotGPT 可以在审查论文时提供快速的第二意见,帮助区分被标记的模式是否在所有工具中一致。任何外部工具的任何报告都不应替代正式学术诚信程序所需的对话和证据审查。Turnitin 检测 AI 还是只检测抄袭这个问题有一个实际的答案:两者,单独地,使用需要人类判断来解释的独立证据。

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。