AI 生成内容水印技术：原理、工具与实践

综述由AI生成人工智能生成内容的水印技术，涵盖可见与不可见水印的原理及工作流。文章详细阐述了图像、文本和音频三种模态下的水印实现方法，对比了开放与封闭系统的优劣，并讨论了数据投毒与签名技术。针对当前面临的鲁棒性、容量及对抗攻击等挑战，提出了未来多模态联合水印与标准化协议的发展方向。

松间照月发布于 2025/2/7更新于 2026/6/219 浏览

近几个月来，我们看到了多起关于'深度伪造 (deepfakes)'或人工智能生成内容的新闻报道：从政治选举到商业欺诈。这些深度伪造内容被用于各种目的，如销售产品、未经授权操纵人物形象、钓鱼获取私人信息，甚至制作误导选民的虚假资料，它们在社交媒体平台的迅速传播，使其具有更广泛的影响力，从而可能造成持久的伤害。

在本篇博文中，我们将介绍 AI 生成内容加水印的方法，讨论其优缺点，并展示 Hugging Face Hub 上一些可用于添加/检测水印的工具。

什么是水印，它是如何工作的？

图 1：可见水印示例

水印是一种标记内容以传递额外信息（如内容的真实性）的方法。在 AI 生成的内容中，水印既可以是完全可见的（如图 1 所示），也可以是完全不可见的（如图 2 所示）。具体来说，在 AI 领域，水印指的是在数字内容（例如图片）中加入特定模式，用以标示内容的来源；这些模式之后可以被人类或通过算法识别。

图 2：不可见水印示例

AI 生成内容的水印主要有两种方法：第一种是在内容创作过程中加入，这需要访问模型本身，但因为它是生成过程的一部分，所以通常更难以被移除。第二种方法是在内容生成后应用，可以用于闭源和专有模型生成的内容，但可能不适用于所有类型的内容（如文本）。

数据投毒与签名技术

除了水印，还有几种相关技术可以限制未经同意的图像操纵。有些技术通过微妙地改变在线分享的图像来防止 AI 算法正确处理这些图像。尽管人类可以正常查看这些图像，但 AI 算法则无法访问类似内容，从而无法创建新图像。这类技术包括 Glaze 和 Photoguard。还有一些工具通过'投毒'图像来破坏 AI 算法训练中的固有假设，使得 AI 系统无法根据在线分享的图像学习人们的外貌——这让这些系统更难以生成假人物图像。这类工具包括 Nightshade 和 Glow。

通过使用'签名'技术，也可以维护内容的真实性和可靠性，这些技术将内容与其来源的元数据链接起来，如 Truepic 的工作，它嵌入了 C2PA 标准。图像签名有助于了解图像的来源。虽然元数据可以被编辑，但像 Truepic 这样的系统通过 1) 提供认证以确保可以验证元数据的有效性；以及 2) 与水印技术整合，使得删除信息更加困难，来克服这一限制。

开放与封闭的水印

为公众提供对水印器和检测器不同级别的访问权有其优点和缺点。开放性有助于促进创新，开发者可以在关键思想上进行迭代，创造出越来越好的系统。然而，这需要与防止恶意使用进行权衡。如果 AI 流程中的开放代码调用了水印器，去除水印步骤变得很简单。即使水印部分是封闭的，如果水印已知且水印代码开放，恶意行为者可能会阅读代码找到方法编辑生成的内容，使水印失效。如果还可以访问检测器，就可能继续编辑合成内容，直到检测器显示低置信度，从而无效化水印。存在一些直接解决这些问题的混合开放 - 封闭方法。例如，Truepic 的水印代码是封闭的，但他们提供了一个可以验证内容凭证的公共 JavaScript 库。IMATAG 的调用水印器代码是开放的，但其验证服务是私有的。

对不同数据类型进行水印

虽然水印是跨多种模态（音频、图像、文本等）的重要工具，但每种模态都带来其独特的挑战和考量。水印的意图也不尽相同，无论是为了防止 训练数据 被用于训练模型、防止内容被操纵、标记模型的输出，还是检测 AI 生成的数据。在本节中，我们将探讨不同的数据模态、它们在水印方面的挑战，以及 Hugging Face Hub 上存在的用于实施不同类型水印的开源工具。

图像水印

可能最为人熟知的水印类型（无论是人类创作还是 AI 生成的内容）是对图像的水印。已经提出了不同的方法来标记训练数据，以影响基于它训练的模型的输出：这种'图像隐身'方法最著名的是 Nightshade，它对图像进行微小的修改，这些修改对人眼来说几乎不可察觉，但会影响基于被污染数据训练的模型的质量。Hub 上也有类似的图像隐身工具——例如，由开发 Nightshade 的相同实验室开发的 Glaze，专门针对人物图像，目的是阻挠面部识别系统。同样，还有 Photoguard，旨在保护图像不被用于生成 AI 工具（例如，基于它们创建深度伪造）的操纵。

关于水印输出图像，Hub 上提供了两种互补的方法：Stable Diffusion Watermark，它通过利用修改过的流行模型（如 Stable Diffusion）在内容生成过程中实施水印；以及 Invisible Watermark，它在图像生成后添加不可见的内容凭证。

AI 生成内容水印技术：原理、工具与实践

什么是水印，它是如何工作的？

数据投毒与签名技术

开放与封闭的水印

对不同数据类型进行水印

图像水印

更多推荐文章

相关免费在线工具

文本水印

音频水印

实施挑战与未来展望

结论

更多推荐文章

相关免费在线工具

AI 生成内容水印技术：原理、工具与实践

什么是水印，它是如何工作的？

数据投毒与签名技术

开放与封闭的水印

对不同数据类型进行水印

图像水印

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

文本水印

音频水印

实施挑战与未来展望

结论

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具