当前位置:首页 > 大杂烩 > 正文内容

lora模型微调-训练准备

高老师3个月前 (07-11)大杂烩267

好的,您提到了最关键的一步,我将为您提供一份极其详尽、可操作的“第三阶段:数据准备”指南。


忘掉技术,我们先把这件事想象成“为一位新来的设计助理准备教学材料”。这位助理(AI模型)非常有才华,但对您公司的风格一无所知。我们的目标是,通过这些材料,教会他两件事:


“什么是我们公司的风格?” (通过一个特殊的“暗号”或“触发词”)

“我们风格下的衣服有哪些变化?” (例如,不同季节、不同廓形、不同材质)

第一步:图片收集与筛选 (教学材料的核心)

1. 我需要准备哪些类型的图片?

您需要的是能够充分、纯粹地代表您品牌核心风格的图片。


来源:


产品画册 (Lookbook):这是最佳来源!图片质量高,风格统一,背景干净。

电商网站产品图:也非常棒,特别是白底或纯色背景的模特图和商品平铺图。

品牌广告大片:可以使用,但要小心。如果背景过于花哨或艺术化,可能会干扰模型学习服装本身。

线下秀场图:可用,但要筛选掉背景复杂、灯光怪异、抓拍模糊的图片。

筛选标准 (非常重要!):


高清晰度:图片必须清晰,能看清服装的轮廓、颜色、材质和细节。最低分辨率建议 1024x1024 像素以上。

主体突出:服装应该是图片的主角。避免多人合照、服装被严重遮挡、或者人物太小看不清的图片。

风格统一:所有图片都应该能体现您品牌一以贯之的设计语言。不要混入其他品牌的图片,这会导致“风格污染”,让AI学串味了。

背景简洁:优先选择纯色背景(白、灰、黑)或简洁的室内外场景。复杂的背景会成为“噪音”,让AI分心。

多样性与平衡:在保持风格统一的前提下,尽量让您的“教学材料”丰富多样。

产品类别:如果您的品牌有连衣裙、衬衫、裤子,都应该包含一些。但如果您只想先训练一个“连衣裙模型”,那就只用连衣裙的图片。

设计元素:包含不同颜色、不同袖长、不同领型、不同裙摆的款式。

拍摄角度:最好有正面、侧面、背面的视图,但以正面全身或半身照为主。

数量:对于LoRA训练,20到50张高质量的图片是一个非常好的起点。少于15张可能效果不佳,多于100张对于CPU训练来说可能过于漫长。质量远比数量重要。


第二步:图片处理 (统一教学材料的格式)

裁剪与尺寸调整:


将所有图片统一处理成正方形,推荐尺寸为 1024x1024 像素。

裁剪时,确保服装主体位于画面中央。如果原始图片不是正方形,可以先裁剪再用白色或黑色填充两侧,使其变成正方形。

文件命名:


使用简单、连续的英文名。例如:

mybrand_dress_001

mybrand_dress_002

...

mybrand_dress_030

文件格式:


将所有图片保存为 .png 或 .jpg 格式。.png 更常用。

第三步:精细化标注 (为每份材料写“注释”)

这是整个过程中最耗时但价值最高的部分。您需要为每一张图片创建一个与之同名的 .txt 文本文件。


黄金法则: 图片 mybrand_dress_001.png 必须对应一个 mybrand_dress_001.txt 文件。


文本文件 (.txt) 的内部格式:

文件内容是一系列用英文逗号隔开的标签 (tags)。这些标签就是您给AI助理看的“注释”。我们将注释分为两大部分:


A部分:触发词 (Trigger Word) - “这是我们的风格暗号”


这是最重要的标签,必须出现在每一个 .txt 文件的开头。

它应该是一个独特的、现实世界中不存在的词。这是为了防止和模型已有的知识冲突。

格式建议:品牌名_产品类别_style。例如:ellassay_dress_style。

这个触发词在所有标签文件中必须完全一致!

B部分:描述性标签 (Descriptive Tags) - “这件衣服具体长什么样”


这部分是向AI描述图片中的具体内容,让它学会把“风格”和“具体设计元素”分离开。这样,以后你就可以通过改变这些描述性标签来自由组合设计了。


建议的标签类别:


主体内容: 1girl (一个女孩), solo (单人), full body (全身照), upper body (半身照)

基础属性:

季节: spring, summer, autumn, winter

场合: business occasion, casual wear, evening party, daily wear

服装核心设计元素:

廓形 (Silhouette): a-line silhouette, h-line silhouette, x-line silhouette (收腰款), cocoon silhouette (茧型)

颜色 (Color): white color, beige color, black, light blue, plaid pattern (格纹), floral print (印花)

材质 (Material): silk material, cotton fabric, chiffon, wool, denim

领型 (Collar): stand-up collar (立领), v-neck, round neck (圆领), lapel collar (翻领)

袖型 (Sleeve): sleeveless (无袖), short sleeves (短袖), long sleeves (长袖), puff sleeves (泡泡袖)

裙长 (Length): mini length (超短), knee length (及膝), maxi length (及踝长裙)

其他细节: with belt (有腰带), ruffle details (荷叶边), pleated (褶皱)

示例演示

假设我们有两张图片:


图片1: ellassay_dress_001.png


是一条米色的、真丝材质的、立领无袖A字连衣裙,适合商务场合。

对应的 ellassay_dress_001.txt 内容应该是:


<TEXT>

ellassay_dress_style, 1girl, solo, full body, business occasion, a-line silhouette, beige color, silk material, stand-up collar, sleeveless, knee length

图片2: ellassay_dress_002.png


是一条黑色的、棉质的、有泡泡袖的、V领H型连衣裙,适合日常穿着。

对应的 ellassay_dress_002.txt 内容应该是:


<TEXT>

ellassay_dress_style, 1girl, solo, upper body, daily wear, h-line silhouette, black color, cotton fabric, v-neck, puff sleeves

关键点回顾:


ellassay_dress_style 这个触发词在两个文件中都一样,且在最前面。

后面的描述性标签根据每张图片的内容而变化。

所有标签都用小写英文,单词之间用下划线 _ 或直接连写,标签与标签之间用逗号 , 隔开。

第四步:整理最终的训练文件夹

完成以上所有步骤后,您需要创建一个最终的文件夹结构,以便训练脚本能够读取它。


创建一个主数据集文件夹,例如 my_dataset。

在里面再创建一个子文件夹,这个子文件夹的命名有特殊格式要求,但为了简单,我们直接用触发词命名,例如 ellassay_dress。

将你处理好的所有 .png 图片和 .txt 标签文件,全部放进这个子文件夹里。

最终的文件夹结构应该是这样的:


<TEXT>

/home/your_user/my_dataset/

└── ellassay_dress/

    ├── ellassay_dress_001.png

    ├── ellassay_dress_001.txt

    ├── ellassay_dress_002.png

    ├── ellassay_dress_002.txt

    ├── ellassay_dress_003.png

    ├── ellassay_dress_003.txt

    │   ...

    ├── ellassay_dress_030.png

    └── ellassay_dress_030.txt

这个 ellassay_dress 文件夹,就是你在第四阶段训练命令中 --train_data_dir 参数需要指向的路径。


扫描二维码推送至手机访问。

版权声明:本文由高久峰个人博客发布,如需转载请注明出处。

本文链接:https://blog.20230611.cn/post/899.html

分享给朋友:

“lora模型微调-训练准备” 的相关文章

svn自动更新到网站

svn自动更新到网站

【一】.钩子文件的设置和创建(1).打开hooks目录,可以看到有一个post-commit.tmpl文件,这是一个模板文件。复制一份,重命名为post-commit,将其用户组设为www,并设置为可执行。chown www:www post-commitchmod +x post-commit(2...

Git本地仓库学习

Git本地仓库学习

1.全局用户信息设置 git  config  --global  user.name  gaojiufeng git  config  --global  user.email  392223903...

PHP安装mongodb扩展

PHP安装mongodb扩展

在安装之前我们先看看官方给出的依赖关系.首先是dll文件和mongodb软件的依赖关系然后是PHP文件和dll的依赖关系我的是phpstudy的集成环境PHP5.4.45 NTS+Apache+Mysql【一】.安装mongodb3.0软件对比依赖关系下载mongodb3.0.msi软件,完整名称:...

Application的错误使用

Application的错误使用

Application 对象用于存储和访问来自任意页面的变量,类似 Session 对象。不同之处在于所有的用户分享一个 Application 对象,而 session 对象和用户的关系是一一对应的。很多的书籍中介绍的Application对象都喜欢以统计在线人数来介绍Application 对象...

Git推送文件到远程仓库

Git推送文件到远程仓库

1.远程仓库的协作模式开发者把自己最新的版本推到线上仓库,同时把线上仓库的最新代码,拉到自己本地即可2.注册git帐号国外: http://www.github.com国内: http://git.oschina.net2.在码云创建项目,不要初始化readmegit push https://gi...

Git从远程仓库更新文件

Git从远程仓库更新文件

 git   pull  https://git.oschina.net/392223903/learn.git   master   换为您的git地址...