Skip to main content
academic-integrityai-detectionguideuniversities

大学如何检查人工智能?完整的机构流程

· 8 min read· NotGPT Team

大学如何检查学生作品中的人工智能?答案不是单一的工具或一个自动化的决定——这是一个分层的过程,从分配通过学习管理系统提交的那一刻开始,甚至可以延伸到与学生的面对面谈话。大多数机构现在对每次提交都运行自动 AI 检测,但分数本身只是第一层。教师将结果与学生既定的写作历史进行比较,管理员审查 LMS 元数据和编辑时间戳,在疑虑仍然存在的情况下,一些大学会要求进行口头后续询问。理解这整个链条——从提交到潜在的小组——让学生对机构 AI 审查的实际情况有了现实的认识。

大学在提交时如何检查人工智能?

关于大学如何检查 AI 最常见的答案始于学习管理系统。在使用 Turnitin 的机构中——截至 2025 年全球估计超过 15,000 个——通过 Canvas、Blackboard、Moodle 或直接 Turnitin 集成提交的每个作业都会自动运行 AI Writing Indicator。教师无需手动触发检查。AI 百分比与抄袭相似性分数一起出现在教员多年来一直审查的相同报告面板中,使 AI 检测成为一个对学生不可见的后台操作,除非他们被显示输出。

对于未大规模运行 Turnitin 的机构,流程会有所不同。有些在机构级别使用 Copyleaks 或 Originality.ai,配置为在部门或课程中的所有提交上运行。其他人依靠 Canvas 的原生 AI 检测功能,教师可以在课程级别启用该功能。较小学院的教师没有机构订阅,通常会下载学生作品并在评分前将其直接粘贴到 GPTZero 或类似工具中。这种变化意味着不同大学的学生面临不同的检测工具,具有不同的分数阈值和不同的解释标准——没有单一的系统定义大学如何在整个范围内检查 AI。

一致的是输出格式:一个概率百分比,表示该工具认为文本由 AI 模型生成的可能性有多大。这个百分比不是一个判决。每个主要平台都在其文档中声明分数需要人工审查,然后才能采取任何学术行动。

  1. Turnitin AI Writing Indicator:对订阅机构的每次提交自动运行
  2. Copyleaks 和 Originality.ai:在机构或部门级别部署,用于 AI 和抄袭联合审查
  3. Canvas 本地检测:当教师在单个课程级别启用时可用
  4. GPTZero:教师广泛使用,他们希望在 LMS 之外进行独立检查
  5. Blackboard:通过插件市场集成第三方检测工具;采用情况因机构而异
"我打开提交时 AI 分数就在那里。我没有改变我工作流程中的任何东西——它在一个学期出现,从那时起一直是报告的一部分。" — 英国大学讲师,2025

除了 AI 检测分数之外,教师还审查哪些信号?

一旦出现检测分数,大多数教师不会将其视为审查的结束。该分数开启了一项询问;额外的背景资料将其关闭。教师通常会将标记的提交与同一课程中学生的其他写作样本进行比较:之前的作业、课堂内论文、讨论帖子或考试答案。一个学生的写作在多个提交中展现出一致的词汇、可识别的文体模式和重复的结构选择,呈现的图景与一个学生的提交质量急剧跳跃而没有解释的学生非常不同。

LMS 元数据为一些教师使用的第二层上下文提供了。Canvas、Turnitin 和 Blackboard 都记录时间戳,显示学生何时打开提交、何时开始编辑以及在最终上传前保存了多少次修订。一篇 2,000 字的论文在文件上传后三秒内提交,没有编辑历史,引发的问题集合与具有修订保存分散在几天内的相同分数非常不同。仅凭元数据不是结论性证据,但熟悉其 LMS 的教师学会了在检测结果旁边阅读它。

一些大学已在部门级别将写作样本比较方法正式化,要求学生在课程开始时提交一篇简短的课堂写作样本,特别是为了建立后来比较的基线。这种做法在写作密集型课程和研究生级别的课程中最为常见,教师在一段时间内对每个学生的声音有了更深的了解。

"我总是查看完整记录——之前的提交、讨论帖子、第一周的课堂写作样本。AI 分数是一个数据点。他们在 12 周内的模式是背景。" — 英文副教授,2026

大学 AI 检测标记后会发生什么?

标记的提交通常遵循三条路径之一,具体取决于机构的学术诚信政策和教师审查整个背景后的判断。

第一条路径是非正式解决。怀疑 AI 使用的教师直接与学生联系以讨论作业。这可能涉及要求学生解释他们的研究过程、描述起草工作时做出的具体决定,或详细说明特定论点如何从课程阅读中发展而来。如果学生能流利地谈论内容——具体的来源、结构选择、主要主张背后的推理——询问通常就此结束。非正式解决避免了正式的行为记录,是教师有权在课程级别处理可疑政策违反行为的机构中最常见的结果。

第二条路径是正式的学术诚信转介。当教师认为证据有必要进行正式审查时,该案件将提交至系学术诚信官员或中央行为办公室。正式诉讼程序需要检测分数以外的有据可查的证据:检测报告、提交本身、用于比较的先前写作样本,以及教师的书面评估,说明为什么证据支持不当行为的发现。在大多数机构中,单独的 AI 检测分数明确不足以维持正式裁定。

第三条路径是没有正式不当行为诉讼程序的作业级别后果。一些教师仅根据有据可查的工作进行评分——课内评估、参与记录、之前的提交——同时对标记的作业保留或降低成绩。这种方法避免了正式系统,在学术诚信政策仍在更新以专门解决 AI 使用的地方更为常见。

  1. 非正式讨论:教师与学生联系,询问他们的写作过程和具体内容决定
  2. 背景审查:将先前的提交、课堂样本和 LMS 元数据与标记的工作进行比较
  3. 正式转介:将有据可查的证据提交给学术诚信官员进行独立审查
  4. 小组听证会:学生陈述他们的账户,独立小组评估证据
  5. 作业级别行动:不提交正式不当行为指控的情况下,保留或降低成绩
"检测分数开启了一项询问。它没有结束一个。我们的小组要求转介教师在安排听证会前提供相关证据。" — 研究大学学术诚信官员,2025

大学是否使用口头后续来验证学生作者身份?

大学如何在初始自动化分数之外检查 AI?口头后续——有时称为 viva voce 评估或作者身份验证面试——是想要一种确认学生作者身份的方法的大学中日益增长的做法,超越统计检测。这种方法很简单:要求学生与他们的教师或审查小组会面,并实时讨论提交的工作内容。问题侧重于提交的具体要素:为什么选择了特定的来源、论点如何发展、如果时间更多学生会改变什么,或提交中的具体主张如何与课程阅读联系。

自己写过作品的学生通常可以相当具体地回答这些问题,即使他们无法从记忆中重现确切的措辞。其提交是由 AI 模型生成的学生没有有意义的参与,通常无法谈论内容背后的具体推理和选择,因为这些选择从未由一个人做出。学生能够阐述的内容与提交声称的内容之间的差距往往比任何检测分数更具启发性。

英国和澳大利亚的大学最早采用了系统化的口头后续方式来处理可疑的 AI 案件,一些机构将作者身份验证纳入标准论文答辩程序。在美国,这种做法更多是临时性的——对提交有疑虑的个别教师直接要求进行对话,没有正式的机构协议。学生应该将任何讨论已提交工作的邀请视为学术调查的正常部分,而不是指控。

"口头后续不是对抗性的。这是关于工作的对话。自己写过论文的学生可以谈论它。这就是我们所检查的。" — 英国大学系主任,2025

大学如何处理 AI 检测中的假阳性?

假阳性——真正的学生作品触发高 AI 检测分数的情况——是部署检测工具的每个机构中的公认问题。Turnitin、GPTZero 和 Copyleaks 的已发布准确性研究显示假阳性率从 4% 到 15% 以上,具体取决于写作风格、主题和作者的背景。2024 年《自然》杂志的一项研究发现,非英语使用者撰写的文本被标记的频率明显高于本地说话者的写作,不是因为检测算法明确有偏见,而是因为表征 AI 输出的相同统计特性——低困惑度、词汇变异有限、句子节奏统一——也表征了由作者留在较窄语言舒适区内撰写的正式学术写作。

大多数机构通过用于处理真正的可疑案件的相同上下文审查流程来处理假阳性:考虑学生整个工作体,同时考虑标记的提交。一个学生具有一致的写作历史且其风格未发生变化,与一个学生的提交代表与所有先前工作的显著背离的位置大不相同。这就是为什么在整个学期参与课堂讨论、提交早期草稿和制作课堂写作样本可提供针对假阳性造成的持久后果的实际保护。

对于在教师询问点收到假阳性的学生,最有效的回应是对写作过程的事实性、具体的说明:查阅了哪些来源、结构如何发展、最终提交前存在哪些草稿。制作早期草稿或研究笔记文档——如果存在——比一般的否认更有说服力。一些机构发布了明确指导,指出单独的检测结果不会在没有支持证据的情况下导致正式行动,但这项政策并不普遍。

  1. 非英语使用者由于正式寄存器和有限的词汇范围而面临更高的假阳性率
  2. 大量编辑的草稿失去了检测器用作人工创作信号的句子长度变化
  3. STEM 和技术写作格式——实验室报告、问题集——比散文更紧密地匹配 AI 统计模式
  4. 写作风格始终正式的学生,无论创作如何,都面临升高的假阳性率
  5. 来自同一课程的已有写作样本是假阳性响应中最有效的证据
"假阳性不是边界情况——它们是当前 AI 检测的系统特性。特定的写作人群将被标记为更高的速率,无论他们的工作有多真实。" — 学术诚信研究员,2025

如何在大学 AI 审查看到你的工作前进行自我检查

关于大学如何检查 AI 的答案包括自动化检测、写作历史比较、LMS 元数据审查和口头后续——这告诉你在截止日期前自我检查的确切位置。目的是在工作仍然是你的时候捕捉统计标记来调整,而不是在提交后了解它。

NotGPT 以移动应用程序格式提供此工作流。粘贴论文、报告或讨论帖子以接收概率分数,并带有句子级突出显示,显示确切哪些段落对结果做出了贡献。对于真实写作持续产生高于预期分数的学生——第二种语言写作的学生、技术领域的学生和广泛修改的学生中常见的模式——Humanize 功能在三个强度级别重写标记的部分,以恢复正式编辑或学术寄存器可能已经平滑的自然变化。

预提交自我检查的实际清单直接遵循大学 AI 检测的工作方式。粘贴完整文档而不仅仅是部分以获得准确的文档级别结果。审查句子级别的突出显示而不是整体百分比。对于每个标记的句子,询问它是否对你的作业进行了与特定内容相关的主张或任何 AI 都可以产生的通用准确声明。用引用特定课程材料、具体示例或你的论文提倡的特定论点的内容替换通用总结句子。大声阅读标记的段落,并在每行运行到相似节奏的地方改变句子长度。修订后运行第二次检查以确认分数移动,并在截止日期前至少两天完成自我检查,以留出时间进行有意义的编辑。

  1. 粘贴完整的作业文本——不仅仅是部分——以获得准确的文档级别分数
  2. 审查句子级突出显示,以确定哪些特定段落正在驱动结果
  3. 检查标记的句子是否特定于你的论证或任何 AI 都可以产生的通用陈述
  4. 用引用特定课程材料、阅读或具体示例的内容替换通用总结句子
  5. 改变标记段落中的句子长度——大声阅读并打破节奏均匀性
  6. 修订后运行第二次检查以确认分数改进,然后再提交
  7. 在截止日期前至少两天完成自我检查,以留出时间进行有意义的编辑

使用NotGPT检测AI内容

87%

AI Detected

“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”

Humanize
12%

Looks Human

“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”

即时检测AI生成的文本和图像。一键将内容人性化。