Skip to main content
ai-detectionturnitinacademic-integritystudents

Turnitin 使用什么 AI 检测工具?深入了解 AI 写作指示器

· 10 min read· NotGPT Team

关于 Turnitin 使用什么 AI 检测工具的最直接答案是:Turnitin 不使用第三方 AI 检测工具——该平台运行自己的专有系统,称为 AI 写作指示器,完全由内部构建和训练。了解 Turnitin 使用什么 AI 检测工具对学生和教师都很重要,因为基础方法论决定了什么样的写作会被标记、得分的可靠性如何,以及特定百分比实际代表什么。本指南涵盖了 Turnitin 的 AI 写作指示器如何开发、它分析什么信号、其输出与其他 AI 检测工具有何不同,以及在提交之前验证自己写作的方法。

Turnitin 使用什么 AI 检测工具?

Turnitin 不许可或嵌入任何来自第三方提供商的外部 AI 检测工具。AI 写作指示器是 Turnitin 研究团队在 2023 年 4 月启动的专有模型。该公司将其检测方法建立在多年来从其剽窃检测数据库积累的学术文本数据之上——这是世界上最大的学生写作数据库之一。这种数据优势使 Turnitin 能够训练一个专门针对学术写作而不是一般互联网文本的模型。AI 写作指示器完全在 Turnitin 反馈工作室界面内运行。当教师为作业启用 AI 检测时,每个合格的提交都会通过该模型自动处理,同时进行标准的相似性检查。这两种分析是独立的——一份文档可以在原创性(低剽窃)和高 AI 可能性上同时得分较高,因为剽窃检测将文本与源数据库进行比较,而 AI 检测分析文本本身的统计属性。Turnitin 公开表示,它投资于构建专有检测而不是依赖第三方工具,是因为学术写作提出了一个独特的挑战:学生论文的正式风格和文体惯例与大多数通用 AI 检测工具训练的在线内容差异很大。他们评估认为,针对学术背景的专用模型比通用工具对正式学生写作的误报率要低。

"我们构建的检测能力专门针对学术背景——在学术写作上训练,而不仅仅是互联网文本。" — Turnitin 研究团队,2023

Turnitin 的 AI 检测工具实际上如何运作?

Turnitin 的 AI 写作指示器分析两个主要统计信号来分配得分:困惑度和突发性。这些是计算语言学中使用的标准指标,用于表征文本在句子级别的可预测性或变异性。困惑度衡量给定周围上下文的每个词选择有多令人惊讶。当语言模型生成文本时,它根据概率选择每个词——根据之前的情况,最统计可能的词。相比之下,人类作者会做出不那么可预测的选择:他们寻求不寻常的同义词,意外地改变节奏,或以语言模型不会采用的方式构建句子。因此,AI 生成的文本往往具有低困惑度——它是非常可预测的,逐字逐句。突发性衡量句子长度和复杂性在整个文档中的变化程度。人类写作自然地在短的、有力的句子和更长的、更复杂的构造之间交替——这创造了一种突发的节奏。AI 生成的文本通常在整个过程中保持一致的句子长度和结构,产生平滑、统一的节奏,记录为低突发性。Turnitin 的模型结合了这些信号,并输出一个百分比,代表越过可能 AI 创作分类阈值的句子比例。不会对任何特定的 AI 工具、提示或输出数据库进行匹配——分析是统计性的,而不是基于指纹的。这意味着检测工具无法告诉您是否使用了 ChatGPT、Claude、Gemini 或任何其他工具。它只报告最终提交文本中的统计模式。

  1. 困惑度分析:根据周围上下文,每个句子的词选择可预测性进行评分
  2. 突发性分析:在整个文档中测量句子长度和结构变异
  3. 句子级分类:越过统计阈值的句子被标记为可能由 AI 生成
  4. 汇总百分比:标记句子的比例成为总体 AI 写作指示器得分
  5. 无工具识别:该模型报告模式,而不是哪个 AI 系统(如果有的话)生成了文本
Turnitin 的模型不会将文本与 AI 生成输出的数据库进行比较。它测量提交本身的统计属性——特别是句子级别的困惑度和突发性。

Turnitin 的 AI 检测工具是第三方工具还是内部开发?

当学生或教师问 Turnitin 使用什么 AI 检测工具时,最常见的后续问题是 Turnitin 是自己构建的还是从其他地方许可的。这很重要,因为包括一些学习管理系统插件在内的几个竞争学术诚信平台确实依赖第三方 AI 检测 API。Turnitin 不是其中之一。AI 写作指示器由 Turnitin 自己的研究团队开发,该公司发布了一系列技术报告和透明度声明,描述其方法论。Turnitin 已明确表示它不嵌入 GPTZero、Originality.ai、Copyleaks 或任何其他外部检测服务。也就是说,许多机构用单独购买的工具补充 Turnitin。一所大学可能通过反馈工作室运行 Turnitin 进行剽窃和 AI 检测,而个别教师或部门也可能订阅像 Copyleaks 或 GPTZero 这样的独立工具以获得第二意见。在这些情况下,学生可能会从同一提交中遇到多个 AI 得分——但只有 Turnitin 反馈工作室报告中的得分来自 Turnitin 自己的专有模型。如果您不确定 LMS 中特定得分来自哪个检测工具,请检查它是否出现在 Turnitin 反馈工作室查看器中(专有)或作为该查看器外的单独徽章或通知(可能是第三方集成)。这些来源之间的混淆是学生报告看到同一文档矛盾 AI 得分的最常见原因之一。

Turnitin 的 AI 百分比实际上意味着什么?

Turnitin 的 AI 写作指示器产生的百分比是句子级比例,而不是文档级信心分数。40% 的结果意味着提交中的 40% 的句子被分类为与 AI 生成的文本统计一致——它不意味着 Turnitin 有 40% 的把握相信整个文档是 AI 编写的。这种区分很重要,因为它影响应该如何解释得分。一份有 40% 标记句子的文档可能意味着很多东西:嵌入在其他人类写作文章中的几个密集段落由 AI 编写,恰好以非常光滑和统一的风格写的结论部分,或像方法描述或文献摘要这样的技术格式化部分,其中学术惯例通过设计产生低的文体变异。Turnitin 本身设置了一个阈值,低于该阈值的结果被认为是不确定的。得分低于 20% 的文档通常在大多数大学的机制政策中被视为低风险,因为该范围的模型信心太低,无法支持任何有意义的结论。在 20% 到 40% 之间,大多数机构将得分视为对话的标志,而不是不当行为的证据。超过 40%,根据某些机制政策,可能会触发正式审查阈值,尽管确切的界限差异很大。得分不识别哪些句子被最有把握地分类——报告中的所有突出显示句子的处理方式相同,无论它们离分类边界有多近或多远。

  1. 低于 20%:Turnitin 认为此范围不确定;大多数机构将其视为低风险
  2. 20%–40%:通常被解释为教师-学生对话的信号,而不是纪律处分行为
  3. 超过 40%:根据某些机制政策,可能会触发正式的学术诚信审查
  4. 百分比是句子比例,而不是整个文档的信心分数
  5. 查看您的机构发布的学术诚信政策,了解他们应用的具体阈值
来自 Turnitin 的 AI 写作指示器的 40% 得分意味着十分之四的句子与该模型关联的 AI 文本的统计签名相匹配——而不是 Turnitin 发现与特定 AI 生成源的 40% 匹配。

Turnitin 的 AI 检测工具最常标记哪些类型的写作?

因为 Turnitin 的模型是在学术写作上训练的,它在将非正式学生散文与 AI 输出区分开来方面的表现比通用检测工具要好。然而,人类写作中的几种模式一致地产生升高的得分,无论文本实际是如何产生的。正式学术风格是最常见的单一因素。掌握了学术写作惯例的学生——结构化段落、清晰的逻辑转折、预览段落内容的主题句——写的散文与 AI 模型产生的非常相似,因为大型语言模型是在大量相同的正式写作上训练的。非英语使用者倾向于获得更高的误报率,因为小心谨慎、语法受限的英语写作缺乏母语使用者自然引入的习语变异。经过大量编辑的草稿往往比未编辑的初稿得分更高,原因相似:编辑过程平滑了自然变异并产生更均匀的统计模式。受限格式的文档——实验室报告、案例研究分析、技术摘要——强加了通过设计产生低文体变异的结构模板。短提交超过 300 个单词也会产生不太可靠的得分,这是 Turnitin 在其文档中承认的一个限制。在任何这些写作背景中得分升高不表示 AI 使用——它表示文本的统计概况与模型从 AI 生成文本中学到的模式重叠。

  1. 正式学术散文——具有清晰转折的结构化论证——从统计上与 AI 输出非常相似
  2. 非英语写作倾向于使用更安全、更可预测的词选择,这些词选择的困惑度低
  3. 经过大量编辑和打磨的草稿失去了自然变异,提高了 AI 相似性得分
  4. 流派受限的格式(实验室报告、案例研究、法律分析)产生结构统一的散文
  5. 短提交少于 300 个词在任何作者身份下都具有降低的统计可靠性
  6. 来自正式来源的引用或总结材料可能有助于升高得分

Turnitin 的 AI 写作指示器的准确度如何?

了解 Turnitin 使用什么 AI 检测工具之后,通常的下一步是问它实际上有多可靠。Turnitin 已发布了其 AI 写作指示器的验证数据。该公司报告对于被分类为超过 80% AI 生成的文档,误报率低于 1%——这意味着在受控测试条件下,少于 100 个完全人类编写的文档中有 1 个应该得分那么高。对于较低的得分范围,误报率较高,这是 Turnitin 建议将低于 20% 的得分视为不确定的原因之一。这些数据来自 Turnitin 在英文学术文本上的内部测试,现实性能可能不同。ESL 写作群体、高度正式的学科以及具有高引文密度的文档在独立研究中都产生了比预期更高的误报率。漏报率——检测工具遗漏的 AI 文本——更难量化,因为它取决于 AI 文本的生成方式,以及在提交前是否应用了任何后处理(释义、人性化或编辑)。Turnitin 也坦诚该模型随着 AI 生成方法的演变而更新。在 2023 年中期无法检测到的文本今天得分可能更高,因为该模型已在较新的 AI 输出模式上进行了再训练。任何 AI 检测工具的准确性不是一个固定的数字——随着生成和检测技术的进步而变化。

Turnitin 发布的研究报告在 80%+ 得分阈值处的误报率低于 1%——但该数字反映的是受控测试条件,而不是现实学生写作群体的完整多样性。

在 Turnitin 运行其 AI 检测工具之前,您应该预先检查您的写作吗?

在提交到 Turnitin 之前,使用辅助 AI 检测工具运行您的草稿,让您具体了解哪些句子最有可能触发标记——并有足够的时间在截止日期前修改。Turnitin 仅在提交后显示得分,大多数作业在原始作业被评分后不提供重新提交。预先检查对于高风险类别的作者特别有价值:用正式学术风格写作的学生、非英语使用者以及任何在受限格式中产生结构化技术内容的人。NotGPT 的 AI 文本检测逐句分析您的文本,并返回带有突出显示段落的概率得分——这是一种与 Turnitin 呈现的格式相似——所以您可以识别您真实写作的哪些部分可能无意中读起来像 AI 生成的。在提交之前修改这些部分意味着当 Turnitin 处理文档时,您的真实声音能清晰地表达出来。在修改后特定段落仍然得分很高的情况下,NotGPT 中的人性化功能可以以浅、中或强强度调整措辞,以引入将自然人类散文与光滑 AI 输出区分开来的文体变异。预先检查只需几分钟,并将原本会是一个成绩后的惊喜转变为您可以在截止日期前使用的可行信息。

  1. 完成您的草稿并在运行预先检查之前完成所有修改
  2. 将完整文本粘贴到 NotGPT 的 AI 文本检测工具中
  3. 查看句子级突出显示以识别哪些段落被评分为可能 AI 生成
  4. 修改标记的句子以引入更多自然变异、具体细节或个人观点
  5. 对修改后仍然得分较高的段落使用人性化功能
  6. 再次通过 NotGPT 运行更新的草稿以确认整体得分已改进
  7. 在截止日期前提交到 Turnitin,更清楚地了解文档的得分方式
"在提交前运行预先检查与校对的学科相同——您正在验证您写的内容读起来是否是您想要的样子。"

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。

相关文章

检测功能

🔍

AI 文本检测

粘贴任何文本并接收 AI 相似性概率得分以及突出显示的部分。

🖼️

AI 图像检测

上传图像以检测它是否由 DALL-E 或 Midjourney 等 AI 工具生成。

✍️

人性化

将 AI 生成的文本改写为听起来自然。选择浅、中或强强度。

使用场景