当前位置:首页 > 大杂烩 > 正文内容

qwen2.5vl模型微调第三天,使用Swift webui生成微调命令

高老师9个月前 (09-22)大杂烩191

(1)、启动webUI,why ?网上资料太乱,很多配置启动不了,那不如直接用webui

/www/server/pyporject_evn/qwen/bin/swift web-ui --lang zh

(2)、配置训练参数

--model_type:qwen2-vl-72b-instruct

--model_id_or_path:qwen/Qwen2-VL-72B-Instruct

--template_type:qwen2-vl

--dataset:这个下拉框是用来选择SWIFT框架内置的公开数据集的。因为您要用自己的数据,留空这个选项,不要选择任何内容。

选中可用GPU:默认自动选中第一张显卡,我需要勾选8张显卡

LoRA目标模块(--lora_target_modules):ALL   指的就是模型中那些最核心的“神经元连接层”。在Transformer架构的模型里,它们通常负责注意力计算(Query, Key, Value)和前馈网络等关键任务。

(3)、点击执行的时候webui会报错记得看看服务端报错,有时候还是缺一堆依赖

扫描二维码推送至手机访问。

版权声明:本文由高久峰个人博客发布,如需转载请注明出处。

本文链接:https://blog.20230611.cn/post/907.html

分享给朋友:

“qwen2.5vl模型微调第三天,使用Swift webui生成微调命令” 的相关文章

Application的错误使用

Application的错误使用

Application 对象用于存储和访问来自任意页面的变量,类似 Session 对象。不同之处在于所有的用户分享一个 Application 对象,而 session 对象和用户的关系是一一对应的。很多的书籍中介绍的Application对象都喜欢以统计在线人数来介绍Application 对象...

Git从远程仓库更新文件

Git从远程仓库更新文件

 git   pull  https://git.oschina.net/392223903/learn.git   master   换为您的git地址...

Git日志查看和版本切换

Git日志查看和版本切换

日志查看:git log版本切换:方式1:git  reset  --hard  HEAD^   倒退一个版本git  reset  --hard  HEAD^^  倒退两个版本方式2:(版本号的形式,建议版本号码补充完...

c#关闭计算机的代码

c#关闭计算机的代码

    1.关机Process.Start("shutdown", "-s -t 0");    2. 注销  Proc...

IIS7.0无法加载CSS的处理办法

IIS7.0无法加载CSS的处理办法

首先网页全部是纯静态的文件,本地测试正常访问,服务器端无法加载CSS,并且无法查看CSS文件的内容。 解决方案:关闭网站的压缩->>静态压缩和动态压缩...

navicat for mysql 11.1.13 企业破解版

navicat for mysql 11.1.13 企业破解版

navicat for mysql 11.1.13 企业破解版.绿色软件免安装,请直接打开安装说明.一定要看说明.下载地址:          http://pan.baidu.com/s/1dFINxNN下载链接失效,直接点击上方QQ呼叫...