tianxiadashi 发表于 2023-7-4 16:28:09

BooruDatasetTagManager(波尔数据集标签管理器)使用指南

# Booru数据集标签管理器

BooruDatasetTagManager(波尔数据集标签管理器)
这是一个用于训练超网络、嵌入、Lora等的数据集的简单标签编辑器。您可以使用图像从零开始创建一个数据集,或者可以使用程序编辑使用自动标记((https://github.com/toriato/stable-diffusion-webui-wd14-tagger), (https://github.com/AUTOMATIC1111/stable-diffusion-webui), etc.)创建的数据集。该编辑器主要用于波尔风格的标记数据,但也可以适应其他数据集。

# 使用

*您需要一个如下所示的数据集:

如果您想要从头开始创建标签,也可以选择不包含文本文件的数据集。在这种情况下,保存时会自动生成文本文件。

[![](https://user-images.githubusercontent.com/1236582/198582869-be2938a7-f7b2-4ad9-8e8c-a53604a24c2d.jpg)](https://user-images.githubusercontent.com/1236582/198582869-be2938a7-f7b2-4ad9-8e8c-a53604a24c2d.jpg)

在程序中,选择“File->Load folder(文件->加载文件夹)”并指定数据集的目录。

[![](https://user-images.githubusercontent.com/1236582/230425218-7718cc79-ba36-48c9-b08f-c36d72633eee.png)](https://user-images.githubusercontent.com/1236582/230425218-7718cc79-ba36-48c9-b08f-c36d72633eee.png)


在左列中,您可以编辑所选图像的标签;在右列中,您可以编辑数据集中所有图像的标签。

编辑完成后,您可以选择"File->Save all changes(文件->保存所有更改)"。

您可以一次选择多个图像进行编辑。这将方便您为同一类型的图像轻松编辑标签。

[![](https://user-images.githubusercontent.com/1236582/230428077-a1e3a724-d5fc-4cf6-a187-e7090c381762.png)](https://user-images.githubusercontent.com/1236582/230428077-a1e3a724-d5fc-4cf6-a187-e7090c381762.png)

通过"文件"菜单,您可以打开设置窗口,自定义应用程序以适应您的需求。对于无法使用Google翻译的用户,可以将翻译服务更改为中文。

[![](https://user-images.githubusercontent.com/1236582/230429522-9ae76b82-f8d7-4f24-81e4-8c7072bd412c.png)](https://user-images.githubusercontent.com/1236582/230429522-9ae76b82-f8d7-4f24-81e4-8c7072bd412c.png)

标签翻译
在使用标签翻译之前,您需要在设置中选择翻译语言和翻译服务。从"view(视图)"菜单中选择"Translate tags(翻译标签)",以显示带有翻译值的列。在显示列时,所有标签将自动翻译成您选择的语言。翻译结果将保存在"Translations"文件夹中,并以所选语言的名称命名。您可以手动编辑该文件中的翻译内容,因为翻译首先从该文件中获取。建议在手动翻译时使用"*"符号进行标记。

翻译文件示例:

```shell notranslate position-relative overflow-auto
//Translation format: <original>=<translation>
black hair=÷åðíûå âîëîñû
*solo=Ñîëî
1girl=1 äåâóøêà
```

目前,手动翻译过滤器只能用于标签自动完成(在设置中启用该选项)。但将来它可以用在其他地方。

# 自动完成的标签列表

[该应用程序支持从“ Booru tag autocompletion for A1111](https://github.com/DominikDoom/a1111-sd-webui-tagcomplete) ”中使用的格式的 csv 文件加载标签。您还可以使用标签列表(逐行)创建自己的 txt 文件。但由于从这些文件加载数据需要很长时间,因此程序将它们转换为自己的格式并从中加载数据。因此,如果您更改标签列表,请做好等待相当长时间的准备。所有带有标签的文件都位于“Tags”文件夹中。

# 其他

此外,您还可以在训练后加载损失统计数据。按“中断”按钮后,您将在控制台中看到每个图像的丢失统计信息。

[![](https://user-images.githubusercontent.com/1236582/198585578-1a958600-cc95-466e-b926-3cfed44b28e4.jpg)](https://user-images.githubusercontent.com/1236582/198585578-1a958600-cc95-466e-b926-3cfed44b28e4.jpg)

将所有文本复制到文件。文件应如下所示:

```shell notranslate position-relative overflow-auto
Loss statistics for file C:\NAI\stable-diffusion-webui\train\NishinoOut2\00006-0-00003-0-98028336_p0.png
loss:0.045±(0.002)
recent 32 loss:0.055±(0.007)
Loss statistics for file C:\NAI\stable-diffusion-webui\train\NishinoOut2\00014-0-00007-0-98909113_p0.png
loss:0.045±(0.002)
recent 32 loss:0.048±(0.007)
...
```

在程序中,选择“File->Load loss from file(文件->从文件加载损失)”,您将看到:

[![](https://user-images.githubusercontent.com/1236582/198586476-6094d32f-b31d-48a2-8ad7-f043417cd78c.jpg)](https://user-images.githubusercontent.com/1236582/198586476-6094d32f-b31d-48a2-8ad7-f043417cd78c.jpg)

您可以自动将标签翻译成您需要的语言。在setting.json 文件中指定您需要的语言的代码。在程序中选择“View->Translate tags(查看->翻译标签)”。
页: [1]
查看完整版本: BooruDatasetTagManager(波尔数据集标签管理器)使用指南