AIGC 检测原理
目前主流的 AIGC 检测手段主要分为两类:传统统计学方法和基于深度学习的风格分类(通常采用 BERT 模型)。
先说结论:知网的 AIGC 检测已从早期的统计学方法升级为 BERT 检测模型。这也是为什么之前 AI 率为 0 的论文,在知网升级后再去检测可能会直接变为 100%。
接下来我们分别介绍这两种方法是如何进行检测的,尽量用通俗易懂的语言来讲解。
统计学方法
主要统计论文中的一些特征值是否符合 AI 写作特征,例如困惑度、突发性等。我们以'突发性'为例,这个概念非常好理解。
突发性指的是输入内容每个句子的长度分布。如果你的论文内容有 10 句话,每句话都是 40-50 个字长度,那么你的内容突发性就很低。如果每一句长度都一样,突发性则为 0。
AI 写的论文的一个显著特征就是句子长度很相近,即突发性很低。也就是说,如果单纯看这一个特征,当输入内容的每个句子长度都差不多时,就会被判定为 AI 写作。
深度学习方法
重点介绍基于 Transformer 架构的 BERT 分类模型。该方法旨在用大量的人类写作论文数据加上 AI 写作论文数据去训练一个模型,让该模型学会区分这两种写作风格,然后用于 AIGC 检测。
简单理解,可以将模型理解为一个人,让他每天都去阅读大量的 AI 论文和人类论文,经过长时间学习,这个人能一眼看出你的论文是不是 AI 写的。
总的来说,统计学方法就是单纯的计算表面特征,BERT 方法是深度理解内容然后区分写作风格。
所以在知网升级前(Turnitin 也是如此),用一些指令让 AI 进行改写,或者直接将所有句号改为逗号等等操作,对于降 AI 率非常有效,因为这本质是改变统计方法中统计的那些特征值,如突发性。
但是知网升级后,BERT 模型可不管你逗号句号,它负责整体理解内容并判断。只要你还是用 AI 改写的,那依旧逃不过检测。
为什么 BERT 对 AI 生成内容检测如此严格?
用指令二次改写也无法逃过吗?
因为现有的 AI 模型如 GPT、DeepSeek 等,是基于 Transformer 架构,而 BERT 检测模型也是基于 Transformer 架构。不同的是:
- GPT 使用 Transformer 架构生成内容(例如生成论文)
- BERT 则是使用 Transformer 架构理解内容(识别论文风格)
所以,你让 AI 去改写 AI 生成的内容,本质上还是 AI 在输出,那么就很难逃过被检测识别的命运。
应对思路与行业现状
根据检测原理,针对性的开发相应的对抗模型是主流方向。
从零开始训练一个模型,让它从'出生'那一刻起就学习像人类一样写作。不是微调、不是模仿现有 AI 的语料,而是真正意义上让模型从第一行参数开始,就只接触人类写作,而不是 AI 生成内容。
具体流程通常是:
- 训练文本检测模型:先用 BERT 架构训练一个检测模型,让它学会区分人类写作 vs AI 写作,判断文本是否具有'人类风格'。
- 训练写作模型:用高质量的人类写作语料,从零开始训练一个生成模型,让它学习人类的写作逻辑、语言风格、文章结构和表达方式。
- 形成闭环:写作模型生成内容 -> 检测模型判断'像不像人写的' -> 给出评分和反馈 -> 写作模型根据反馈继续学习。
最终目标是得到高精度 AIGC 检测模型和人类风格写作模型,将任何 AI 生成的论文改写为人类的写作风格。
需要注意的是,所有训练数据均为论文,所以模型不适合其它领域(如小说、新闻等)。
关于检测机制的思考
AI 的出现应该是辅助我们提升写作效率,而不应该在查重的基础上,再让我们背上 AIGC 检测的包袱。
论文查重尚可理解,哪里标红都有解释,重复段落是和哪篇文章重复了。那么 AI 率呢?作何解释?完全的黑箱操作,平台说啥就是啥!
各个平台,如知网、万方、维普等对于同一篇论文的检测结果都不一样。因为 AIGC 检测结果无法解释,靠写作风格判定。
训练一个这样的检测器,没什么技术难度,主要是数据方面。这些所谓的提供 AIGC 检测服务的平台,基于大量的学生毕业论文或期刊论文去训练模型,然后再反过来向学生收取高昂的检测费用,形成一个商业闭环。
对于一个学生来说,动辄几十上百的 AIGC 检测费用,是否合理确实值得商榷。


