ms-swift新手教程：如何用Web-UI零代码训练模型

优质文章学习记录

09 Apr 2026 — 8 min read

ms-swift新手教程：如何用Web-UI零代码训练模型

1. 引言：为什么选择ms-swift进行模型微调？

在大模型时代，微调（Fine-tuning）已成为将通用预训练模型适配到特定任务的核心手段。然而，传统微调流程往往涉及复杂的代码编写、环境配置和参数调试，对非专业开发者极不友好。

ms-swift 是由魔搭社区推出的轻量级大模型微调框架，支持600+纯文本大模型与300+多模态大模型的全链路开发，涵盖训练、推理、评测、量化与部署。其最大亮点之一是提供了 Web-UI 界面，让开发者无需编写任何代码即可完成从数据准备到模型部署的全流程操作。

本文将带你从零开始，使用 ms-swift 的 Web-UI 实现一次完整的 LoRA 微调实践，目标是对 Qwen2.5-7B-Instruct 模型进行自我认知微调，最终生成一个具备个性化身份识别能力的对话模型。

2. ms-swift 核心功能概览

2.1 支持的模型与任务类型

ms-swift 覆盖了当前主流的大语言模型和多模态模型，包括：

纯文本大模型：Qwen3、Llama4、Mistral、DeepSeek-R1、GLM4.5 等
多模态大模型：Qwen3-VL、InternVL3.5、MiniCPM-V-4、Ovis2.5 等

同时支持多种训练任务： - 预训练（PT） - 指令监督微调（SFT） - 偏好学习（DPO、KTO、CPO、SimPO、ORPO） - 强化学习（GRPO、DAPO、RLOO） - 序列分类、Embedding、Reranker

2.2 关键技术优势

特性	说明
轻量训练	支持 LoRA、QLoRA、DoRA 等参数高效微调方法，7B 模型仅需 9GB 显存
显存优化	集成 GaLore、Flash-Attention 2/3、Ulysses 和 Ring-Attention 技术
分布式训练	支持 DDP、FSDP、DeepSpeed ZeRO 及 Megatron 并行策略
多模态支持	支持图文音视频混合模态训练，支持多模态 packing 加速
界面化操作	提供 Web-UI 零代码训练界面，降低使用门槛

3. 准备工作：环境安装与启动

3.1 安装 ms-swift

确保你的系统已安装 Python ≥ 3.8 和 PyTorch ≥ 2.0。推荐使用 Conda 创建独立环境：

conda create -n swift python=3.10 conda activate swift

安装 ms-swift：

pip install ms-swift -U

若需使用 vLLM 进行高性能推理，建议额外安装：

pip install vllm

3.2 启动 Web-UI 服务

执行以下命令启动 Web-UI 界面：

swift web-ui

启动成功后，终端会输出类似信息：

Running on local URL: http://127.0.0.1:7860

打开浏览器访问 http://127.0.0.1:7860 即可进入图形化操作界面。

提示：如需远程访问，可通过 --host 0.0.0.0 参数开放绑定地址，并确保防火墙允许端口通信。

4. 使用 Web-UI 进行零代码模型微调

4.1 界面功能模块介绍

Web-UI 主要包含以下几个功能区域：

Model Selection：选择基础模型（如 Qwen2.5-7B-Instruct）
Dataset Configuration：配置训练数据集路径或 ID
Training Parameters：设置训练超参数（学习率、batch size、epoch 数等）
LoRA Settings：配置 LoRA 相关参数（rank、alpha、target modules）
Output & Logging：指定输出目录、日志频率、保存策略
Start Training：一键启动训练任务

4.2 步骤一：选择基础模型

在 “Model Selection” 区域： - 在搜索框中输入 Qwen2.5-7B-Instruct - 选择模型来源为 ModelScope（默认）

系统将自动拉取该模型的元信息，包括 tokenizer 类型、上下文长度（8192）、是否支持多模态等。

注意：首次加载模型可能需要较长时间下载权重文件，请保持网络畅通。

4.3 步骤二：配置训练数据集

在 “Dataset Configuration” 中： - 输入数据集 ID：AI-ModelScope/alpaca-gpt4-data-zh#500 和 swift/self-cognition#500 - 或上传本地 JSONL 文件作为自定义数据集

每个数据集格式应符合如下结构：

{ "instruction": "你是谁？", "input": "", "output": "我是通义千问，由阿里云研发的大模型助手。" }

对于 self-cognition 数据集，还可通过 --model_author 和 --model_name 设置模型作者和名称，用于个性化身份注入。

4.4 步骤三：设置训练参数

在 “Training Parameters” 表单中填写以下关键参数：

参数	推荐值	说明
`num_train_epochs`	1	训练轮数
`per_device_train_batch_size`	1	单卡 batch size
`learning_rate`	1e-4	学习率
`max_length`	2048	最大序列长度
`warmup_ratio`	0.05	学习率预热比例
`logging_steps`	5	每 5 步记录一次 loss
`save_steps`	50	每 50 步保存一次 checkpoint
`eval_steps`	50	每 50 步评估一次

勾选 “Enable Evaluation” 可启用验证集评估功能。

4.5 步骤四：配置 LoRA 微调参数

在 “LoRA Settings” 中设置：

参数	推荐值	说明
`lora_rank`	8	LoRA 低秩矩阵维度
`lora_alpha`	32	缩放系数，通常为 rank 的 4 倍
`lora_dropout`	0.1	Dropout 概率
`target_modules`	all-linear	应用 LoRA 的模块，`all-linear` 表示所有线性层
`bias`	none	是否训练偏置项

建议：对于中文任务，lora_rank=8 已足够；若追求更高性能可尝试 16 或 32。

4.6 步骤五：设置输出路径并启动训练

在 “Output & Logging” 中： - 设置 output_dir 为 ./output - 设置 save_total_limit 为 2，防止磁盘占用过多

点击 “Start Training” 按钮，Web-UI 将自动生成对应 CLI 命令并在后台执行：

swift sft \ --model Qwen/Qwen2.5-7B-Instruct \ --train_type lora \ --dataset 'AI-ModelScope/alpaca-gpt4-data-zh#500' 'swift/self-cognition#500' \ --torch_dtype bfloat16 \ --num_train_epochs 1 \ --per_device_train_batch_size 1 \ --learning_rate 1e-4 \ --lora_rank 8 \ --lora_alpha 32 \ --target_modules all-linear \ --gradient_accumulation_steps 16 \ --max_length 2048 \ --output_dir output \ --system 'You are a helpful assistant.' \ --warmup_ratio 0.05

训练过程将在页面实时显示 loss 曲线、GPU 利用率、显存占用等监控指标。

5. 模型推理与效果验证

5.1 使用 Web-UI 进行交互式推理

训练完成后，切换至 “Inference” 标签页： - 选择训练生成的 adapter 路径（如 output/vx-xxx/checkpoint-xxx） - 输入 prompt：“你是谁？” - 点击 “Generate” 查看回复

预期输出示例：

我是 swift-robot，由 model_author swift 训练的专属助手。

这表明模型已成功学习到自我认知信息。

5.2 合并 LoRA 权重并导出完整模型

若需将 LoRA 适配器合并回原始模型以便独立部署，可在 “Export” 页面操作： - 选择 base model 和 adapter 路径 - 勾选 “Merge LoRA” - 点击 “Export Model”

导出后的模型可直接用于 vLLM、LMDeploy 等推理引擎。

6. 常见问题与优化建议

6.1 常见问题排查

问题	可能原因	解决方案
显存不足	batch size 过大或模型太大	降低 `per_device_train_batch_size`，增加 `gradient_accumulation_steps`
训练中断	网络不稳定导致下载失败	使用本地缓存模型路径
输出乱码	tokenizer 不匹配	确认模型与 tokenizer 一致
loss 不下降	学习率过高或数据质量差	调整学习率至 5e-5 或检查数据格式

6.2 性能优化建议

使用 BF16 精度：添加 --torch_dtype bfloat16 提升训练稳定性
启用 Flash Attention：若 GPU 支持，添加 --use_flash_attn true
梯度累积模拟大 batch：当显存受限时，通过 --gradient_accumulation_steps 提高有效 batch size
早停机制：结合 eval loss 设置 --save_strategy steps 和 --load_best_model_at_end

7. 总结

本文详细介绍了如何使用 ms-swift 的 Web-UI 实现零代码模型微调，涵盖了环境搭建、界面操作、参数配置、训练执行与推理验证的完整流程。

ms-swift 的 Web-UI 极大地降低了大模型微调的技术门槛，使得研究人员、产品经理甚至业务人员都能快速构建定制化模型。其核心优势在于：

✅ 零代码操作：无需编写 Python 脚本即可完成全流程
✅ 可视化监控：实时查看训练状态与资源消耗
✅ 灵活扩展：支持自定义数据集、多模型切换、多种微调方式
✅ 生产就绪：支持模型合并、量化导出与 OpenAI 兼容接口部署

未来，随着更多自动化调参、智能数据增强和多模态融合功能的加入，ms-swift 将进一步推动大模型 democratization 的进程。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 ZEEKLOG星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

ms-swift新手教程：如何用Web-UI零代码训练模型

优质文章学习记录