Skip to main content
ai-detectionacademic-integrityguidelms

SafeAssign 能检测 ChatGPT 吗?学生需要知道的事项

· 8 min read· NotGPT Team

SafeAssign 是否能检测 ChatGPT 取决于一个大多数学生无法了解的细节——您的学校运行的是哪个版本的 Blackboard,以及 IT 部门激活了哪些可选功能。SafeAssign 是作为抄袭相似度检查工具而不是 AI 检测器构建的:它将提交的文本与现有内容的参考数据库进行比较,由于 ChatGPT 生成原始文本而不是从索引源复制,一篇纯 ChatGPT 写的论文通常在 SafeAssign 的传统相似度报告中得分很低。自 2023 年以来,现在拥有 Blackboard 的公司 Anthology 开始向该平台推出可选的 AI 检测附加功能,情况变得更加复杂。SafeAssign 是否能检测 ChatGPT 在您的学校取决于该机构的配置——在许多情况下,学生从未被告知哪种方式。

SafeAssign 能检测 ChatGPT 吗?

简短的回答是:默认情况下不能,也不是大多数学生认为的方式。SafeAssign 的核心功能是相似度检测。它将提交的文本分解为重叠的短语片段,并将其与包含索引网页、许可学术期刊和先前提交的学生作业池的全球参考数据库进行匹配。ChatGPT 不会从该数据库中提取文本——它根据训练期间学到的统计模式生成新的词序列。一篇新的 ChatGPT 论文按照 SafeAssign 的原始定义完全是原创的,这意味着它通常会产生低的抄袭相似度分数。这是许多学生在测试 ChatGPT 输出时注意到的结果:相似度百分比接近零,他们得出结论 SafeAssign 根本无法检测 ChatGPT。当 SafeAssign 是唯一的工具时,这个结论是准确的,但它忽略了较新的层次。从 2023 年开始,Anthology 开始将 AI 概率指示器作为更新的 SafeAssign 功能集的一部分提供。这个组件不是将文本与数据库进行比较——它运行单独的概率分析,旨在识别与语言模型相关的写作模式。该功能是否在您的 Blackboard 课程中启用取决于您的机构与 Anthology 的合同层级、其内部 IT 配置,以及通常由系或讲师级别的决定。不同大学的两名学生可能会提交几乎相同的 ChatGPT 论文,但体验完全不同:一个看到低相似度分数,根本没有 AI 标记,另一个在同一报告中看到低相似度分数和提高的 AI 概率指示器。

为什么 SafeAssign 将 ChatGPT 提交评分为原创?

要理解为什么 ChatGPT 文本逃脱了 SafeAssign 的传统检查,需要快速查看该工具是如何构建的。SafeAssign 的相似度算法基于 n-gram 匹配模型工作。它从提交中提取短的重叠短语,并在其参考语料库中查找这些确切或接近确切的短语。这种方法在捕获复制粘贴抄袭、密切转述段落和回收早期学期的论文方面表现出色。它无法检测 ChatGPT 的原因是结构性的:ChatGPT 合成新文本而不是检索或重新排列现有文本。它生成的句子没有出现在 SafeAssign 的数据库中,因为它们在用户运行该特定提示之前不存在。没有可以找到的匹配项。这与当应用于 AI 写作时影响每个抄袭相似度工具的限制相同。原创性并不意味着人类写的——只意味着文本没有以索引形式出现在其他地方。一个从购买的论文工厂复制论文的学生会因为相同的结构性原因显示低相似度分数,如果该论文还未被提交到任何地方。SafeAssign 的相似度百分比回答的问题是“这段文本是否与已知的现有内容匹配?”——它无法回答“一个人类写的这个吗?”这些是不同的问题,将它们混淆是关于 SafeAssign 能否检测的大部分混淆的根源。

"低 SafeAssign 相似度分数并不意味着作品是人类写的。它意味着文本与已经在参考数据库中的内容不匹配——这是一个非常不同的事情。"

Anthology 为 ChatGPT 添加了 AI 检测层吗?

是的,但有注意事项。Anthology 一直在开发并逐步推出 SafeAssign 中的 AI 写作检测功能,作为其学术诚信路线图的一部分,该路线图遵循 2022 年末 ChatGPT 的公开发布。该功能在 Blackboard 成绩簿报告中显示为单独的指示器——与抄袭相似度百分比不同——并提供提交的文本是 AI 生成的估计概率。这个 AI 检测层与相似度检查的工作方式根本不同。它不是数据库匹配,而是使用经过训练以识别与语言模型输出相关的信号的统计文本分类器。两个主要信号是困惑度——给定周围上下文中每个词选择的可预测性的衡量——和爆发度,它捕捉段落内句长和复杂性变化的程度。像 ChatGPT 输出这样的 AI 生成文本倾向于低困惑度,因为模型选择统计上可能的词序列,并倾向于低爆发度,因为其输出缺乏人类文本的自然节奏变化。当两个信号都指向 AI 作者身份时,分类器会产生高概率分数。当它们混合或模糊时,分数会下降到中间范围,这对讲师来说可能更难采取行动。重要的注意事项是该功能的机构采纳情况不均衡。一些学校已在所有 Blackboard 作业中启用它。其他学校仅在特定部门或特定作业类型中启用它。许多机构仍在运行不包含该功能的较旧 Blackboard 版本。从提交界面,学生无法可靠地判断哪种情况适用于他们的课程——无论后台运行的是什么,提交面板看起来都是一样的。

  1. 学生通过标准 Blackboard 作业界面提交作品
  2. SafeAssign 运行其 n-gram 比较并生成抄袭相似度百分比
  3. 如果启用了 AI 检测模块,单独的分类器会分析相同的文本,以查找困惑度和爆发度信号
  4. 两个分数都会出现在讲师可见的 Blackboard 成绩簿报告中
  5. 讲师在决定是否提出问题之前,查看组合报告和学生的完整提交历史

如果 SafeAssign 将您的写作标记为 AI 会怎样?

来自 SafeAssign 的提高的 AI 概率指示器并不自动意味着成绩处罚或正式学术不诚实指控。Anthology 自己的指导将分数视为讲师审查的起点,而不是结论,大多数采纳该功能的机构都遵循相同的模式。典型的流程始于讲师在学生在课程中的其他作业背景下审查被标记的提交。一个论文得分为 85% AI 概率但在整个学期中一直产生强劲写作的学生看起来不同于早期作业较弱并突然提交磨光、流畅论文的学生。讲师通常被期望在将任何事情上报到正式学术诚信委员会之前与学生进行直接交流。该对话可能涉及要求学生介绍他们的研究和写作过程、产生草稿或笔记、解释特定段落,或完成简短的面对面或口头组件。假阳性是所有 AI 检测平台中的一个已知问题。2023 年至 2025 年间发表的同行评审研究发现特定子群的错误率范围从 4% 到超过 15%,非英语使用者和使用正式或技术寄存器的作者风险最高。一个以特别结构化的学术风格写作的学生——或者严重依赖规范化句子结构的语法纠正工具——尽管他们写了每一个词本身,可能仍会收到标记。如果这发生在您身上,最有效的回应是进入讲师对话并提供具体证据:显示您写作过程的已保存文档草稿、研究会话的浏览器历史、引用笔记以及您在撰写期间创建的任何书面大纲材料。

  1. 从您的讲师那里请求特定的 SafeAssign 报告,以便您可以看到确切哪些段落或指标被标记
  2. 在对话之前收集您的写作过程的所有证据:已保存的草稿、大纲文件、笔记和浏览器研究历史
  3. 联系您的讲师以请求会议,并将其框架化为介绍您的过程的机会
  4. 在会议期间,参考您的草稿并解释您在被标记提交中对特定段落的选择
  5. 如果情况升级到正式流程,请联系您的机构的学术诚信办公室,了解您的权利和审查时间表
"检测分数打开一次对话——它们并不结束。没有可信的学术诚信审查依赖于单一自动概率分数,而不检查学生工作的全部背景。"

SafeAssign 在检测 ChatGPT 生成文本方面的准确性如何?

Anthology 尚未为 SafeAssign 的 AI 检测功能发布详细的公开精度基准,这使得独立评估困难。来自可比学术 AI 检测器的第三方评估存在的东西提供了一般框架:在受控条件下针对明确 AI 生成的学术英语进行测试的设计良好的商业分类器通常以 85-93% 的速率识别 AI 文本。该数字在现实条件下大幅下降。短于 200 字的短提交不会给分类器足够的文本来产生可靠的信号。已被有意重写、逐句编辑或与原始分析相结合的 ChatGPT 输出通常落入模糊的中等概率范围。非英语使用者面临更高的假阳性率,因为对其第一语言训练模式感觉完全自然的句子结构可能类似于表征语言模型输出的高概率序列。ChatGPT 本身也是一个不断变化的目标。较新的模型版本经过细化,引入了更多表面级别的变化,一些提示技术会产生难以让统计分类器高置信度识别的输出。SafeAssign 的 AI 检测分数最好被理解为一个概率指示器——它告诉您文本表现出的模式在 AI 生成的写作中统计上比典型人类写作更常见,给定分类器的训练数据。它不会用确定性确立作者身份。将高分数视为明确证据的讲师冒着既惩罚真正写了作品的学生又造成看似客观发现的风险,而底层方法无法支持。

SafeAssign 在实际提交上的 AI 检测精度——尤其是混合或轻微编辑的作品——远低于实验室基准数字所暗示的,当学术后果处于风险中时,误差范围很重要。

讲师是否使用额外的工具来捕捉 ChatGPT?

许多讲师都在这样做,工具范围因机构和学科而异。SafeAssign 是一个 Blackboard 原生工具,但它不是讲师可以访问的唯一学术诚信资源。Turnitin 作为一个单独的订阅平台运营,提供自己的 AI 写作指示器,并通过学习工具互操作性 (LTI) 连接器与 Blackboard 集成。一些机构在同一作业上同时运行 SafeAssign 和 Turnitin——学生通过 Blackboard 提交一次,两个工具并行分析文本。GPTZero、Copyleaks 和 Winston AI 也通过类似的 LTI 途径由机构许可,这意味着学生在 Blackboard 中看到的提交界面可能会将其文本路由到与 SafeAssign 无关的工具。除了专用检测平台外,讲师越来越多地依赖没有任何算法提供的上下文信号。一个在课堂讨论中参与流利但提交高度技术性论文(使用与该讨论不一致的词汇和论证结构)的学生会提出软件单独无法框架化的问题。课堂写作样本、已提交作品的口头答辩和围绕个人经历或课程特定背景设计的作业都是讲师用来减少 ChatGPT 帮助的有用性并更容易识别它的教学策略。对学生的实际影响是“SafeAssign 是否检测 ChatGPT”这个问题只是图景的一部分。即使在 SafeAssign 的 AI 检测模块关闭的学校,讲师也可能在运行外部工具、应用上下文判断,或两者兼有。通过每个自动检查的提交仍然受一个知道您其他工作外观的人的审查。

在通过 Blackboard 提交之前,您应该检查您的作品吗?

无论您是否相信 SafeAssign 的 AI 检测是否处于活动状态,在作业截止日期之前进行自检都是实际的一步。如果您以正式学术寄存器写作、使用规范化句子结构的语法工具,或用 AI 帮助撰写草稿的任何部分,然后大幅编辑,您可能不知道该作品对统计分类器的读法,直到您自己测试。NotGPT 在句子级别分析文本并突出显示具有最强 AI 相似性信号的段落,让您在讲师看到任何内容之前查看提交中哪些部分最有可能引起注意。这在两个方向上都有用:如果您完全自己写了作品并想确认您的正式文文不会标记,预检给您该信息,而您仍然有时间进行调整。如果您将 AI 用于草稿的任何部分并进行了编辑,检查您的最终版本会向您显示检测配置改变了多少。目标不是欺骗任何系统——而是了解您的文本对您的机构可能运行的相同类别工具的读法,以便您可以在提交截止日期之前做出知情决定,而不是在之后响应询问。

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。

相关文章

检测功能

🔍

AI 文本检测

粘贴任何文本并接收带有突出显示部分的 AI 相似度概率分数。

🖼️

AI 图像检测

上传图像以检测它是否由 DALL-E 或 Midjourney 等 AI 工具生成。

✍️

人性化

重写 AI 生成文本,使其听起来更自然。选择轻度、中度或强度改写。

使用场景