当前位置:首页 > 大杂烩 > 正文内容

qwen2.5vl模型微调第三天,使用Swift webui生成微调命令

高老师4个月前 (09-22)大杂烩94

(1)、启动webUI,why ?网上资料太乱,很多配置启动不了,那不如直接用webui

/www/server/pyporject_evn/qwen/bin/swift web-ui --lang zh

(2)、配置训练参数

--model_type:qwen2-vl-72b-instruct

--model_id_or_path:qwen/Qwen2-VL-72B-Instruct

--template_type:qwen2-vl

--dataset:这个下拉框是用来选择SWIFT框架内置的公开数据集的。因为您要用自己的数据,留空这个选项,不要选择任何内容。

选中可用GPU:默认自动选中第一张显卡,我需要勾选8张显卡

LoRA目标模块(--lora_target_modules):ALL   指的就是模型中那些最核心的“神经元连接层”。在Transformer架构的模型里,它们通常负责注意力计算(Query, Key, Value)和前馈网络等关键任务。

(3)、点击执行的时候webui会报错记得看看服务端报错,有时候还是缺一堆依赖

扫描二维码推送至手机访问。

版权声明:本文由高久峰个人博客发布,如需转载请注明出处。

本文链接:https://blog.20230611.cn/post/907.html

分享给朋友:

“qwen2.5vl模型微调第三天,使用Swift webui生成微调命令” 的相关文章

c#中string和StringBuilder效率对比

c#中string和StringBuilder效率对比

    c#中string和StringBuilder直接看看执行速度。(2).String类型累计赋值Test               ...

Git本地仓库学习

Git本地仓库学习

1.全局用户信息设置 git  config  --global  user.name  gaojiufeng git  config  --global  user.email  392223903...

Application的错误使用

Application的错误使用

Application 对象用于存储和访问来自任意页面的变量,类似 Session 对象。不同之处在于所有的用户分享一个 Application 对象,而 session 对象和用户的关系是一一对应的。很多的书籍中介绍的Application对象都喜欢以统计在线人数来介绍Application 对象...

Git推送文件到远程仓库

Git推送文件到远程仓库

1.远程仓库的协作模式开发者把自己最新的版本推到线上仓库,同时把线上仓库的最新代码,拉到自己本地即可2.注册git帐号国外: http://www.github.com国内: http://git.oschina.net2.在码云创建项目,不要初始化readmegit push https://gi...

c#关闭计算机的代码

c#关闭计算机的代码

    1.关机Process.Start("shutdown", "-s -t 0");    2. 注销  Proc...

C# md5加密,C# md5加密代码

C# md5加密,C# md5加密代码

public static string GetMD5(string str) {     //创建MD5对象     MD5 md5 = MD5.C...