Stable Diffusion WebUI 数据集标签编辑工具详解
Stable Diffusion WebUI Dataset Tag Editor 是 AUTOMATIC1111 WebUI 的一个扩展插件,专为高效管理和编辑图像数据集的标注信息而设计。对于 AI 绘画创作者或数据标注人员来说,它能显著提升标签处理的效率。
主要特性
智能识别与推荐
编辑器内置了多种自动识别模型,如 BLIP2、Git Large 等,位于 scripts/dataset_tag_editor/interrogators/ 目录下。这些模型能为图像生成专业的描述性标签建议,减少手动输入的工作量。
可视化批量操作
提供可视化的批量编辑界面,支持对多张图像的标签进行统一管理。你可以轻松执行添加、删除、替换等操作,避免重复劳动。
安装与配置
部署步骤
将项目代码复制到 WebUI 的 extensions 目录中,然后重启 WebUI。启动后,在界面上即可看到 "Dataset Tag Editor" 标签页。
克隆项目源码:
git clone <repository_url>
初始设置
首次使用时,需要指定数据集目录路径并配置加载选项。建议开启 "Backup original text file"(备份原始文本文件)功能,以防误操作导致数据丢失。
实际操作流程
加载与预览
在设置面板中输入 Dataset directory 路径,点击 Load 按钮。系统会自动扫描目录下的图像文件,并在左侧画廊展示预览图。
筛选与定位
利用 Positive/Negative Filter 功能,可以通过逻辑表达式快速定位特定标签的图像。例如,使用 OR(a broccoli, a pizza) AND NOT OR(oil painting) 这样的逻辑,可以筛选出包含西兰花或披萨但排除油画风格的图片。
精细编辑
选中单张图片后,支持以下操作:
- 读取并修改现有标签
- 调用 Interrogate 功能重新识别标签
- 选择标签添加模式(覆盖、前缀、后缀)
批量清洗
通过正则表达式搜索替换功能,可以批量修正标签内容。比如将 (\\d)boy(s?) 替换为 \\1girl\\2,就能实现性别标签的统一转换。
优化与设置
在 WebUI 的 Settings 选项卡中,还可以调整一些底层参数:
- 图像画廊的列数布局
- 临时文件的使用策略
- 与 Stable Diffusion 核心模型的兼容性参数
常见问题
Q:支持哪些图像格式? A:通常支持 JPG、PNG、WEBP 等常见格式,与 WebUI 保持一致。
Q:如何保证数据安全? A:务必开启备份功能,并在执行批量操作前仔细核对筛选条件。
Q:如何提高识别准确率?
A:可以尝试切换不同的识别器模型,或者在 userscripts/taggers/ 目录下添加自定义标签器。
建议
- 定期备份重要数据集
- 使用子目录分类管理不同主题的图像
- 建立统一的标签命名规范
掌握这些技巧后,你就能充分利用该工具的功能,为你的 AI 绘画项目提供更高质量的训练数据。

