AIGC 率:一个开发者必须面对的质量指标
最近在项目里用 ChatGPT 这类大模型生成内容时,总被一个词困扰——AIGC 率。简单来说,它衡量的是生成内容与模型训练数据中已有内容的相似度,或者说'机器味儿'有多浓。对于开发者而言,高 AIGC 率不仅意味着内容可能缺乏新意、流于模板化,在严肃的应用场景(如知识输出、创意写作、代码生成)中,更可能引发原创性不足、甚至潜在的合规风险。因此,学会通过指令(Prompt)有效控制 AIGC 率,从'能用'走向'用好',成了我们进阶路上的必修课。
1. 高 AIGC 率问题的根源:为什么模型总在'复读'?
要解决问题,先要理解问题从何而来。大语言模型本质上是基于海量数据训练出的概率模型,其生成过程是预测下一个最可能的词元(Token)。这导致了几种常见的高 AIGC 率诱因:

