Internvl2.5 38B训练后如何merge checkpoints和原来的权重 #2900

han3889847 · 2025-01-10T07:30:29Z

您好，我用自己数据微调Internvl2.5-38B，损失下降都是正常的
输出了

我merge-lora使用指令
swift merge-lora
--ckpt_dir /llmcapagroup1/jtcvdata/hjn/hjn/ms-swift-main/output/InternVL2_5-38B/checkpoint-300
总是报错出现问题：

而且图里我没看到有intern2.5的字样

我该如何使用生成的权重合并原有38B进行LMdelpoy推理

Jintao-Huang · 2025-01-10T08:01:27Z

你看看训练和merge的swift版本是不是不一致

一个 swift3，一个swift2

han3889847 · 2025-01-10T08:09:58Z

这两个都是一套代码和环境，都是modelscope下载docker镜像，且

中的version.py中写着的版本是3.0.0

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Internvl2.5 38B训练后如何merge checkpoints和原来的权重 #2900

Internvl2.5 38B训练后如何merge checkpoints和原来的权重 #2900

han3889847 commented Jan 10, 2025

Jintao-Huang commented Jan 10, 2025

han3889847 commented Jan 10, 2025

Internvl2.5 38B训练后如何merge checkpoints和原来的权重 #2900

Internvl2.5 38B训练后如何merge checkpoints和原来的权重 #2900

Comments

han3889847 commented Jan 10, 2025

Jintao-Huang commented Jan 10, 2025

han3889847 commented Jan 10, 2025