好的,您提到了最关键的一步,我将为您提供一份极其详尽、可操作的“第三阶段:数据准备”指南。
忘掉技术,我们先把这件事想象成“为一位新来的设计助理准备教学材料”。这位助理(AI模型)非常有才华,但对您公司的风格一无所知。我们的目标是,通过这些材料,教会他两件事:
“什么是我们公司的风格?” (通过一个特殊的“暗号”或“触发词”)
“我们风格下的衣服有哪些变化?” (例如,不同季节、不同廓形、不同材质)
第一步:图片收集与筛选 (教学材料的核心)
1. 我需要准备哪些类型的图片?
您需要的是能够充分、纯粹地代表您品牌核心风格的图片。
来源:
产品画册 (Lookbook):这是最佳来源!图片质量高,风格统一,背景干净。
电商网站产品图:也非常棒,特别是白底或纯色背景的模特图和商品平铺图。
品牌广告大片:可以使用,但要小心。如果背景过于花哨或艺术化,可能会干扰模型学习服装本身。
线下秀场图:可用,但要筛选掉背景复杂、灯光怪异、抓拍模糊的图片。
筛选标准 (非常重要!):
高清晰度:图片必须清晰,能看清服装的轮廓、颜色、材质和细节。最低分辨率建议 1024x1024 像素以上。
主体突出:服装应该是图片的主角。避免多人合照、服装被严重遮挡、或者人物太小看不清的图片。
风格统一:所有图片都应该能体现您品牌一以贯之的设计语言。不要混入其他品牌的图片,这会导致“风格污染”,让AI学串味了。
背景简洁:优先选择纯色背景(白、灰、黑)或简洁的室内外场景。复杂的背景会成为“噪音”,让AI分心。
多样性与平衡:在保持风格统一的前提下,尽量让您的“教学材料”丰富多样。
产品类别:如果您的品牌有连衣裙、衬衫、裤子,都应该包含一些。但如果您只想先训练一个“连衣裙模型”,那就只用连衣裙的图片。
设计元素:包含不同颜色、不同袖长、不同领型、不同裙摆的款式。
拍摄角度:最好有正面、侧面、背面的视图,但以正面全身或半身照为主。
数量:对于LoRA训练,20到50张高质量的图片是一个非常好的起点。少于15张可能效果不佳,多于100张对于CPU训练来说可能过于漫长。质量远比数量重要。
第二步:图片处理 (统一教学材料的格式)
裁剪与尺寸调整:
将所有图片统一处理成正方形,推荐尺寸为 1024x1024 像素。
裁剪时,确保服装主体位于画面中央。如果原始图片不是正方形,可以先裁剪再用白色或黑色填充两侧,使其变成正方形。
文件命名:
使用简单、连续的英文名。例如:
mybrand_dress_001
mybrand_dress_002
...
mybrand_dress_030
文件格式:
将所有图片保存为 .png 或 .jpg 格式。.png 更常用。
第三步:精细化标注 (为每份材料写“注释”)
这是整个过程中最耗时但价值最高的部分。您需要为每一张图片创建一个与之同名的 .txt 文本文件。
黄金法则: 图片 mybrand_dress_001.png 必须对应一个 mybrand_dress_001.txt 文件。
文本文件 (.txt) 的内部格式:
文件内容是一系列用英文逗号隔开的标签 (tags)。这些标签就是您给AI助理看的“注释”。我们将注释分为两大部分:
A部分:触发词 (Trigger Word) - “这是我们的风格暗号”
这是最重要的标签,必须出现在每一个 .txt 文件的开头。
它应该是一个独特的、现实世界中不存在的词。这是为了防止和模型已有的知识冲突。
格式建议:品牌名_产品类别_style。例如:ellassay_dress_style。
这个触发词在所有标签文件中必须完全一致!
B部分:描述性标签 (Descriptive Tags) - “这件衣服具体长什么样”
这部分是向AI描述图片中的具体内容,让它学会把“风格”和“具体设计元素”分离开。这样,以后你就可以通过改变这些描述性标签来自由组合设计了。
建议的标签类别:
主体内容: 1girl (一个女孩), solo (单人), full body (全身照), upper body (半身照)
基础属性:
季节: spring, summer, autumn, winter
场合: business occasion, casual wear, evening party, daily wear
服装核心设计元素:
廓形 (Silhouette): a-line silhouette, h-line silhouette, x-line silhouette (收腰款), cocoon silhouette (茧型)
颜色 (Color): white color, beige color, black, light blue, plaid pattern (格纹), floral print (印花)
材质 (Material): silk material, cotton fabric, chiffon, wool, denim
领型 (Collar): stand-up collar (立领), v-neck, round neck (圆领), lapel collar (翻领)
袖型 (Sleeve): sleeveless (无袖), short sleeves (短袖), long sleeves (长袖), puff sleeves (泡泡袖)
裙长 (Length): mini length (超短), knee length (及膝), maxi length (及踝长裙)
其他细节: with belt (有腰带), ruffle details (荷叶边), pleated (褶皱)
示例演示
假设我们有两张图片:
图片1: ellassay_dress_001.png
是一条米色的、真丝材质的、立领无袖A字连衣裙,适合商务场合。
对应的 ellassay_dress_001.txt 内容应该是:
<TEXT>
ellassay_dress_style, 1girl, solo, full body, business occasion, a-line silhouette, beige color, silk material, stand-up collar, sleeveless, knee length
图片2: ellassay_dress_002.png
是一条黑色的、棉质的、有泡泡袖的、V领H型连衣裙,适合日常穿着。
对应的 ellassay_dress_002.txt 内容应该是:
<TEXT>
ellassay_dress_style, 1girl, solo, upper body, daily wear, h-line silhouette, black color, cotton fabric, v-neck, puff sleeves
关键点回顾:
ellassay_dress_style 这个触发词在两个文件中都一样,且在最前面。
后面的描述性标签根据每张图片的内容而变化。
所有标签都用小写英文,单词之间用下划线 _ 或直接连写,标签与标签之间用逗号 , 隔开。
第四步:整理最终的训练文件夹
完成以上所有步骤后,您需要创建一个最终的文件夹结构,以便训练脚本能够读取它。
创建一个主数据集文件夹,例如 my_dataset。
在里面再创建一个子文件夹,这个子文件夹的命名有特殊格式要求,但为了简单,我们直接用触发词命名,例如 ellassay_dress。
将你处理好的所有 .png 图片和 .txt 标签文件,全部放进这个子文件夹里。
最终的文件夹结构应该是这样的:
<TEXT>
/home/your_user/my_dataset/
└── ellassay_dress/
├── ellassay_dress_001.png
├── ellassay_dress_001.txt
├── ellassay_dress_002.png
├── ellassay_dress_002.txt
├── ellassay_dress_003.png
├── ellassay_dress_003.txt
│ ...
├── ellassay_dress_030.png
└── ellassay_dress_030.txt
这个 ellassay_dress 文件夹,就是你在第四阶段训练命令中 --train_data_dir 参数需要指向的路径。
【一】.钩子文件的设置和创建(1).打开hooks目录,可以看到有一个post-commit.tmpl文件,这是一个模板文件。复制一份,重命名为post-commit,将其用户组设为www,并设置为可执行。chown www:www post-commitchmod +x post-commit(2...
1.全局用户信息设置 git config --global user.name gaojiufeng git config --global user.email 392223903...
在安装之前我们先看看官方给出的依赖关系.首先是dll文件和mongodb软件的依赖关系然后是PHP文件和dll的依赖关系我的是phpstudy的集成环境PHP5.4.45 NTS+Apache+Mysql【一】.安装mongodb3.0软件对比依赖关系下载mongodb3.0.msi软件,完整名称:...
Application 对象用于存储和访问来自任意页面的变量,类似 Session 对象。不同之处在于所有的用户分享一个 Application 对象,而 session 对象和用户的关系是一一对应的。很多的书籍中介绍的Application对象都喜欢以统计在线人数来介绍Application 对象...
1.远程仓库的协作模式开发者把自己最新的版本推到线上仓库,同时把线上仓库的最新代码,拉到自己本地即可2.注册git帐号国外: http://www.github.com国内: http://git.oschina.net2.在码云创建项目,不要初始化readmegit push https://gi...
git pull https://git.oschina.net/392223903/learn.git master 换为您的git地址...