Quetext AI 检测器:工作原理、检测内容以及何时使用其他工具
Quetext 最为人所知的是作为一个抄袭检查工具,使用该公司所谓的深度搜索技术,将提交的文本与大型的网页、学术资源和之前提交的文档数据库进行比较。在 2023 年,随着写作验证领域中大多数工具的步伐,Quetext 在其平台上增加了 AI 检测器——使其成为几个现在将 AI 写作检测与相同工作流程捆绑在一起的抄袭检查器之一。如果你一直在使用 Quetext 检查工作,想要了解 AI 检测器实际上做什么,或者如果你正在评估 Quetext 是否是专门用于捕捉 AI 生成的写作的正确工具,本指南涵盖了 Quetext AI 检测器的工作原理,它在哪里表现相当不错,以及在以抄袭为主的平台中构建的检测的局限性开始出现的地方。
目录
什么是 Quetext AI 检测器?
Quetext 起初作为一个抄袭检测工具推出,这个起源决定了它如何处理 AI 生成的文本。该公司的核心产品是 DeepSearch,一个上下文抄袭检查工具,不仅检查确切的短语匹配,还检查释义和结构相似的内容——这是一种比旧的字符串匹配工具更复杂的方法。Quetext AI 检测器后来才被添加,被定位为对抄袭检查的伴随功能,而不是独立产品。当你通过 Quetext 提交文本时,你可以在同一工作流中运行两项检查:针对 Quetext 数据库的抄袭扫描和针对分类模型的 AI 检测。组合输出通过 Quetext 的 ColorGrade 反馈系统显示,其中各部分根据风险级别进行颜色编码。AI 检测组件返回概率分数并突出显示模型与 AI 生成模式相关联的各个句子。对于已经使用 Quetext 进行抄袭检查的学生和教育工作者来说,AI 检测器本质上是一个附加功能,不需要改变现有工作流程。实际问题不是该功能是否存在——它确实存在——而是与从头开始以 AI 检测为主要目标而构建的工具相比,其结果应该有多大的重要性。
Quetext AI 检测器如何工作?
Quetext AI 检测器与这个领域中大多数文本分类工具一样,依赖于提交文本的统计属性,而不是将其与已知的 AI 生成内容数据库进行比较。大多数检测模型依赖的两个信号是困惑度(Perplexity)和突发性(Burstiness)。困惑度测量单词序列的统计可预测性:大型语言模型通过选择高概率的下一个令牌来生成文本,产生平滑、低困惑度的输出。人类作者选择单词的原因超越了概率——节奏、强调、特有的习惯——这产生的文本具有更高的平均困惑度。突发性捕捉句子长度和结构的变化。人类写作往往在这方面是不均匀的:长的、从属的句子出现在短的、生硬的句子旁边。AI 输出围绕更一致的节奏聚集,因为模型正在优化连贯性而不是文体多样性。该检测模型在已知 AI 生成文本与已知人类写作的数据集上进行训练,以根据这些信号对新输入进行分类。Quetext 没有发布关于其检测模型的详细技术文档——其训练数据的组成、它所权重的具体特征或随着新 AI 工具的发布模型的重新训练频率在公开场合是不可用的。这在商业 AI 检测器中很常见,但这使得独立准确性验证变得困难,这意味着用户无法评估模型如何处理来自较新一代工具的输出。
Quetext AI 检测器在实践中的准确性如何?
Quetext 没有为其 AI 检测器发布准确性基准,这些基准可以与专用 AI 检测工具进行直接比较。来自学生论坛、教师社区和独立评论者的非正式社区测试表明,Quetext AI 检测器在明确的情况下表现相当充分——直接由 ChatGPT 或类似工具生成的文本,没有编辑后的文本往往会收到较高的 AI 概率分数。有意义的准确性差距出现在实践中最重要的场景中。短文本是任何 AI 检测器的最弱情况,该工具遵循相同的模式:少于 200 字的文本不包含足够的统计材料来产生可靠的分类。非英语使用者面临更高的误报风险,因为形式上、语法上精确的散文在统计上可能类似于 AI 输出——低突发性、可预测的单词选择——即使每个单词都是由人类写的。经过大量编辑的 AI 草稿在所有平台(包括 Quetext)上以更高的速率滑过检测:如果用户使用 AI 工具生成文本,然后大幅重写它,基础统计模式被破坏的足够充分以降低检测分数。也许与 Quetext 背景最相关的是:专业技术写作、法律文件和正式的学术散文都倾向于在 AI 检测中获得更高的分数,因为它们的结构化形式性模仿了检测器与生成文本相关联的模式。
来自 Quetext AI 检测器或任何其他工具的任何检测分数都应被视为仔细阅读文本的理由,而不是结论。检测器测量的统计模式是真实的信号,但它们不是明确的标识符。
Quetext AI 检测器在哪些方面存在不足?
在社区报告和该工具的非正式测试中,多个故障模式似乎是一致的。了解这些有助于你负责任地使用结果,避免根据可能不反映你正在审查的文本的实际来源的分数进行操作。最常见的问题是对合法人类写作的误报——特别是来自非英语使用者的形式化或学术散文,它可以展示检测模型与 AI 生成相关联的相同低困惑度、低突发性模式。一个在第二语言中小心翼翼地写作的学生经常会产生文本,在这些模型看来比随意写作的英语使用者更像 AI。专业领域的文本——医学摘要、法律分析、工程文档——倾向于得分更高,因为它们遵循严格的结构约定,在统计上反映了 AI 输出。另一方面,那些由 AI 生成但随后由人类大幅重写的文本倾向于得分低于其来源所表明的:大量编辑破坏了检测器寻找的统计特征,足以产生降低的分数。这些限制对 Quetext AI 检测器来说并不独特——它们适用于该类别中的每个工具——但在决定给予任何个别结果多少权重时,它们是重要的背景。
- 少于 200 字的短文本:统计模式不足以进行任何检测器上的可靠分类
- 非英语形式化写作:低突发性和谨慎的单词选择即使在完全由人类编写的文本中也可能类似于 AI 输出
- 专业技术或法律散文:结构化形式性在所有检测器中模仿 AI 生成模式
- 经过大量人类编辑的 AI 草稿:重写破坏了检测器寻找的统计特征
- 来自最近发布的 AI 模型的输出:训练数据可能尚未包括其特定的统计模式
- 混合作者身份的文件:人类和 AI 之间的协作写作是最难可靠分类的文本类别
Quetext 的 AI 检测器对学术使用来说足够好吗?
答案在很大程度上取决于正在进行的决定的风险,以及抄袭检查还是 AI 检查是你使用 Quetext 的主要原因。对于抄袭检测,Quetext 的 DeepSearch 技术是真正有竞争力的——它处理上下文相似性而不仅仅是精确的短语匹配,网络内容和学术资源的数据库覆盖范围很广。对于 AI 检测特别是,Quetext 占据了一个中等水平:比根本不进行 AI 检查更有能力,但不如从头开始构建 AI 检测作为主要目标的工具那样专注。使用 Quetext 作为其机构的主要 AI 筛选工具的教育工作者应该了解,它没有对学术写作格式的经过校准的训练,而像 GPTZero 这样的工具特别开发。GPTZero 在真实学生写作——论文、报告、作业提交——上训练其模型,这使其更精确地调整为出现在课堂环境中的模式。对于在提交论文前进行自我检查的学生来说,如果你已经为抄袭检查打开了平台,Quetext AI 检测器是一个合理的起点。重要的注意事项是,清洁的 Quetext 结果不能保证你的机构的主要工具会产生清洁的结果——不同的检测器经常在同一文本上不同意,而 Quetext 结果不是对专用机构检测器将产生什么的可靠预览。
你应该如何将 Quetext 与其他 AI 检测工具一起使用?
使用任何单个 AI 检测器(包括 Quetext AI 检测器)的最可靠方法是将其视为更广泛审查过程中的一个信号,而不是独立的判决。通过两个或三个工具运行相同的文本并比较结果一致和差异的地方,会比任何单个分数单独提供更多可操作的信息。在跨多个工具的特定标记段落上的一致是比单个工具标记文本其他工具通过的更强信号。当结果明显分歧时,下一步是自己阅读标记的段落并评估它们是否显示可识别的模式:异常统一的句子结构、没有自然变化的一致形式、缺少具体细节的通用框架。对于定期检查提交内容的工作流——教师审查学生作业、编辑筛选贡献者工作——实际建议是使用 Quetext AI 检测器作为初始通过的一部分,该通过会捕捉明显的情况,然后在采取任何正式行动之前通过专用 AI 检测器运行评分提升的文本以获取第二意见。NotGPT 在移动设备上提供实时句子级突出显示,这使其成为 Quetext 标记的段落的便利第二意见,而无需单独的桌面会话。无论你最终选择了哪种工具组合,独立记录你的检查过程,将提升的分数记录与对标记文本的审查一起保存,并避免在重要情况下将任何自动化结果视为确定性。
- 将 Quetext AI 检测用作第一遍——当你已经在同一工作流中进行抄袭检查时,这很方便
- 在采取任何正式行动之前,通过第二个专用 AI 检测器运行标记的文本以获取第二意见
- 比较两个工具标记的特定段落——对段落的一致是比单工具结果更强的信号
- 自己阅读标记的句子以寻找结构模式:统一的节奏、缺失的具体细节、缺少自然变化
- 独立记录你的审查过程——分数单独在学术或专业环境中是不充分的证据
- 对于学生:通过 Quetext AI 检测器运行你的草稿以识别你的机构的工具可能标记的段落,然后相应地进行修改
交叉引用两个工具在同一文本上——然后自己阅读标记的段落——比任何单个 AI 检测器分数(包括来自 Quetext 的分数)产生更多可防御的结论。
使用NotGPT检测AI内容
AI Detected
“The implementation of artificial intelligence in modern educational environments presents numerous compelling advantages that merit careful consideration…”
Looks Human
“AI in schools has real upsides worth thinking about — but the trade-offs are just as real and shouldn't be glossed over…”
即时检测AI生成的文本和图像。一键将内容人性化。
相关文章
检测功能
AI 文本检测
粘贴任何文本并接收 AI 相似性概率分数和突出显示的部分。
AI 图像检测
上传图像以检测它是否由 DALL-E 或 Midjourney 等 AI 工具生成。
人化
重写 AI 生成的文本以听起来自然。选择浅色、中等或强大强度。