Booru数据集标签管理器
BooruDatasetTagManager(波尔数据集标签管理器)
这是一个用于训练超网络、嵌入、Lora等的数据集的简单标签编辑器。您可以使用图像从零开始创建一个数据集,或者可以使用程序编辑使用自动标记(wd14-tagger, stable-diffusion-webui, etc.)创建的数据集。该编辑器主要用于波尔风格的标记数据,但也可以适应其他数据集。
使用
*您需要一个如下所示的数据集:
如果您想要从头开始创建标签,也可以选择不包含文本文件的数据集。在这种情况下,保存时会自动生成文本文件。
在程序中,选择“File->Load folder(文件->加载文件夹)”并指定数据集的目录。
在左列中,您可以编辑所选图像的标签;在右列中,您可以编辑数据集中所有图像的标签。
编辑完成后,您可以选择"File->Save all changes(文件->保存所有更改)"。
您可以一次选择多个图像进行编辑。这将方便您为同一类型的图像轻松编辑标签。
通过"文件"菜单,您可以打开设置窗口,自定义应用程序以适应您的需求。对于无法使用Google翻译的用户,可以将翻译服务更改为中文。
标签翻译
在使用标签翻译之前,您需要在设置中选择翻译语言和翻译服务。从"view(视图)"菜单中选择"Translate tags(翻译标签)",以显示带有翻译值的列。在显示列时,所有标签将自动翻译成您选择的语言。翻译结果将保存在"Translations"文件夹中,并以所选语言的名称命名。您可以手动编辑该文件中的翻译内容,因为翻译首先从该文件中获取。建议在手动翻译时使用"*"符号进行标记。
翻译文件示例:
//Translation format: <original>=<translation>
black hair=÷åðíûå âîëîñû
*solo=Ñîëî
1girl=1 äåâóøêà
目前,手动翻译过滤器只能用于标签自动完成(在设置中启用该选项)。但将来它可以用在其他地方。
自动完成的标签列表
该应用程序支持从“ Booru tag autocompletion for A1111 ”中使用的格式的 csv 文件加载标签。您还可以使用标签列表(逐行)创建自己的 txt 文件。但由于从这些文件加载数据需要很长时间,因此程序将它们转换为自己的格式并从中加载数据。因此,如果您更改标签列表,请做好等待相当长时间的准备。所有带有标签的文件都位于“Tags”文件夹中。
其他
此外,您还可以在训练后加载损失统计数据。按“中断”按钮后,您将在控制台中看到每个图像的丢失统计信息。
将所有文本复制到文件。文件应如下所示:
Loss statistics for file C:\NAI\stable-diffusion-webui\train\NishinoOut2\00006-0-00003-0-98028336_p0.png
loss:0.045±(0.002)
recent 32 loss:0.055±(0.007)
Loss statistics for file C:\NAI\stable-diffusion-webui\train\NishinoOut2\00014-0-00007-0-98909113_p0.png
loss:0.045±(0.002)
recent 32 loss:0.048±(0.007)
...
在程序中,选择“File->Load loss from file(文件->从文件加载损失)”,您将看到:
您可以自动将标签翻译成您需要的语言。在setting.json 文件中指定您需要的语言的代码。在程序中选择“View->Translate tags(查看->翻译标签)”。