LLaMA-Factory 快速入门（五）：终端命令实操记录

优质文章学习记录

07 Apr 2026 — 5 min read

文章目录

1. 引言
2. 命令使用
3. 总结

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时，llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估，还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法，帮助你快速上手并高效完成相关任务。

2. 命令使用

命令	功能简述
llamafactory-cli api	启动 OpenAI 风格的 API 服务
llamafactory-cli chat	在命令行中启动聊天界面
llamafactory-cli eval	评估模型
llamafactory-cli export	合并 LoRA 适配器并导出模型
llamafactory-cli train	训练模型
llamafactory-cli webchat	启动网页聊天界面
llamafactory-cli webui	启动 LlamaBoard 界面
llamafactory-cli version	显示版本信息

2.1 version（显示版本）

功能：显示 LLaMA-Factory 的版本信息，验证安装是否成功

执行命令：

llamafactory-cli version

执行后的效果如下：

2.2 webui（启动 LlamaBoard 界面）

功能：启动可视化界面 LlamaBoard，提供图形化操作入口

执行命令：

llamafactory-cli webui

执行后返回：

浏览器访问：http://127.0.0.1:7860

2.3 chat（命令行聊天）

功能：接在终端中与模型进行对话，无需启动网页

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

执行效果如下：

当然也可以从模型训练完的chekcpoint启动，命令如下：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1

2.4 webchat（网页聊天）

功能：启动网页端聊天界面

webchat的功能跟chat命令差不多，只是webchat是给了一个web页面进行对话。最小化命令如下：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

当然也可以从模型训练完的chekcpoint启动webchat，跟chat命令差不多：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

2.5 api（启动 API 服务）

功能：启动 OpenAI 风格的 API 服务

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如执行：

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

可以看到输出了如下信息：

浏览器访问：http://localhost:8000/docs

可以看到开放了3种API，分别是：

接口名称	路径	说明
List Models	`/v1/models`	列出当前可用的模型，用于查看可选择的模型信息
Create Chat Completion	`/v1/chat/completions`	生成聊天回复，用于对话或文本生成
Create Score Evaluation	`/v1/score/evaluation`	对模型输出进行评分或评估，用于检测生成内容质量

直接执行ListModels列出当前可用的模型，可以看见返回：

执行Create Chat Completion，示例请求内容如下：

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好，可以自我介绍一下吗？"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回：

2.6 train（训练模型）

功能：启动训练流程，对模型进行微调

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.7 eval（评估模型）

功能：：对训练后的模型进行性能评估

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.8 export（导出模型）

功能：合并 LoRA 适配器并导出最终模型

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能，包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务，以及训练、评估、导出等核心操作。

可以先从 chat / webchat 开始，快速体验模型效果；
如果需要部署服务，建议使用 api 模式；
完整训练流程中，train → eval → export 是必经的三个步骤。

通过灵活使用这些命令，大家可以快速搭建起属于自己的大模型微调与应用环境。

SQL学习路上的AI导航：初级开发者如何避免弯路焦虑？—— 老码农的实战指南

前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎点赞 + 收藏 + 关注哦 💕 📚 本文简介本文探讨了AI时代初级软件开发者在学习新技术（如SQL）时的路径焦虑问题。文章分析了AI优化学习路径的工作原理，揭示了其基于数据拟合的局限性，并通过SQL代码示例和真实案例展示了人类学习者在试错中积累的不可替代价值。作者指出，AI推荐路径虽高效但可能忽略个人上下文和行业变化，并提供了结合AI与人类智慧的实战指南，如定制学习路径、利用SQL生态工具和培养学习直觉。核心观点认为，AI可作为辅助工具，但人类开发者的主动性、批判性思维和跨界联想能力才是避免弯路、守护学习主权的关键。目录 * 📚 本文简介 * 📚 引言：当AI成了学习路上的“GPS”，我们该信导航还是信直觉？ * 📚 一、先别慌！扒一扒AI优化学习路径的“底裤” * 📘 1.1 AI推荐学习路径的原理：本质是“数据拟合”而非“个性化定制” * 📘 1.2 AI路径推荐的“翻车现场”：当标准化遇上真

2026 年最新权威 AI 编程工具推荐，强烈建议收藏

随着 AI 技术在编程领域的深度渗透，高效智能的 AI 编程工具已成为开发者提升产能、降低门槛的核心装备。2026 年，AI 编程工具从单一代码补全进化到全链路开发辅助，从被动响应升级为主动协作，成为开发者不可或缺的 "AI 同事"。以下是 8 款主流 AI 编程工具的深度评测，帮你找到最适合自己的开发伙伴。一、推荐榜单 TOP8 1. Trae（字节跳动旗下 AI 原生 IDE）作为字节跳动深耕 AI 编程领域的核心产品，Trae 凭借贴合中文开发者习惯的设计和全链路开发辅助能力，成为 2026 年最值得关注的 AI 编程工具之一。截至目前，Trae 累计注册用户已突破 600 万，覆盖近 200 个国家和地区，

医疗AI中的马尔科夫链深度应用与Python实现(2025年版)

核心应用场景 1. 疾病进展建模：慢性病状态转移预测（如糖尿病分期） 2. 治疗决策优化：不同治疗方案的成本效益分析 3. 生存分析：患者生存率动态预测 4. 医院资源调度：患者流量预测与床位优化 Python实现示例：糖尿病进展预测模型 import numpy as np import pandas as pd import matplotlib.pyplot as plt from

DeerFlow 2.0实战指南：生产级AI Agent框架的Docker化部署与并行编排

前言：为什么要选择DeerFlow 2.0？最近字节跳动开源的DeerFlow 2.0在GitHub上火了，几天时间收获45,000+星。作为一名技术开发者，我第一时间研究了这个项目。经过深入测试，我发现它解决了传统AI Agent框架在生产环境中的几个关键痛点。本文将从工程实践角度，带你完整掌握DeerFlow 2.0的核心功能和部署方法。一、核心技术架构解析 1.1 Docker隔离机制传统框架的问题：多个任务共享进程，一个任务崩溃影响全局。 DeerFlow 2.0的解决方案：每个任务独立Docker容器。核心代码实现： # 任务容器创建函数defcreate_task_container(task_id, skill_config): container = docker_client.containers.run( image="deerflow-agent-base:latest", command=

文章目录

1. 引言

2. 命令使用

2.1 version（显示版本）

2.2 webui（启动 LlamaBoard 界面）

2.3 chat（命令行聊天）

2.4 webchat（网页聊天）

2.5 api（启动 API 服务）

2.6 train（训练模型 ）

2.7 eval（评估模型 ）

2.8 export（导出模型 ）

3. 总结

Read more

SQL学习路上的AI导航：初级开发者如何避免弯路焦虑？—— 老码农的实战指南

2026 年最新权威 AI 编程工具推荐，强烈建议收藏

医疗AI中的马尔科夫链深度应用与Python实现(2025年版)

DeerFlow 2.0实战指南：生产级AI Agent框架的Docker化部署与并行编排

2.6 train（训练模型）

2.7 eval（评估模型）

2.8 export（导出模型）