LLaMA-Factory 快速入门（五）：终端命令实操记录

优质文章学习记录

10 Apr 2026 — 5 min read

文章目录

1. 引言
2. 命令使用
3. 总结

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时，llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估，还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法，帮助你快速上手并高效完成相关任务。

2. 命令使用

命令	功能简述
llamafactory-cli api	启动 OpenAI 风格的 API 服务
llamafactory-cli chat	在命令行中启动聊天界面
llamafactory-cli eval	评估模型
llamafactory-cli export	合并 LoRA 适配器并导出模型
llamafactory-cli train	训练模型
llamafactory-cli webchat	启动网页聊天界面
llamafactory-cli webui	启动 LlamaBoard 界面
llamafactory-cli version	显示版本信息

2.1 version（显示版本）

功能：显示 LLaMA-Factory 的版本信息，验证安装是否成功

执行命令：

llamafactory-cli version

执行后的效果如下：

2.2 webui（启动 LlamaBoard 界面）

功能：启动可视化界面 LlamaBoard，提供图形化操作入口

执行命令：

llamafactory-cli webui

执行后返回：

浏览器访问：http://127.0.0.1:7860

2.3 chat（命令行聊天）

功能：接在终端中与模型进行对话，无需启动网页

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

执行效果如下：

当然也可以从模型训练完的chekcpoint启动，命令如下：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1

2.4 webchat（网页聊天）

功能：启动网页端聊天界面

webchat的功能跟chat命令差不多，只是webchat是给了一个web页面进行对话。最小化命令如下：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

当然也可以从模型训练完的chekcpoint启动webchat，跟chat命令差不多：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

2.5 api（启动 API 服务）

功能：启动 OpenAI 风格的 API 服务

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如执行：

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

可以看到输出了如下信息：

浏览器访问：http://localhost:8000/docs

可以看到开放了3种API，分别是：

接口名称	路径	说明
List Models	`/v1/models`	列出当前可用的模型，用于查看可选择的模型信息
Create Chat Completion	`/v1/chat/completions`	生成聊天回复，用于对话或文本生成
Create Score Evaluation	`/v1/score/evaluation`	对模型输出进行评分或评估，用于检测生成内容质量

直接执行ListModels列出当前可用的模型，可以看见返回：

执行Create Chat Completion，示例请求内容如下：

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好，可以自我介绍一下吗？"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回：

2.6 train（训练模型）

功能：启动训练流程，对模型进行微调

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.7 eval（评估模型）

功能：：对训练后的模型进行性能评估

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.8 export（导出模型）

功能：合并 LoRA 适配器并导出最终模型

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能，包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务，以及训练、评估、导出等核心操作。

可以先从 chat / webchat 开始，快速体验模型效果；
如果需要部署服务，建议使用 api 模式；
完整训练流程中，train → eval → export 是必经的三个步骤。

通过灵活使用这些命令，大家可以快速搭建起属于自己的大模型微调与应用环境。

Whisper.cpp终极指南：零基础实现快速语音识别的完整方案

Whisper.cpp终极指南：零基础实现快速语音识别的完整方案【免费下载链接】whisper.cppOpenAI 的 Whisper 模型在 C/C++ 中的移植版本。项目地址: https://gitcode.com/GitHub_Trending/wh/whisper.cpp 你是否曾经因为语音识别速度太慢而失去耐心？😫 想要在普通电脑上实现实时语音转文字，却被复杂的GPU配置搞得头晕眼花？别担心，今天我将带你用最简单的步骤，让whisper.cpp在CPU环境下也能实现闪电般的语音识别速度！为什么选择Whisper.cpp进行语音识别？ whisper.cpp作为OpenAI Whisper模型的C++移植版本，相比原版Python实现有着天然的性能优势。它不需要昂贵的GPU设备，在普通CPU上就能流畅运行，特别适合个人开发者和小型项目使用。三步快速安装配置指南 🚀 第一步：获取项目源码首先需要下载whisper.cpp项目代码，这是所有操作的基础： git clone https://gitcode.com/GitHub_

Llama-3.2-3B实战：用Ollama生成营销文案

Llama-3.2-3B实战：用Ollama生成营销文案电商商家每天需要制作大量商品营销文案，人工撰写不仅耗时耗力，还难以保证创意和质量。本文将展示如何用Llama-3.2-3B模型快速生成高质量营销文案，让你的产品描述瞬间变得吸引人。 1. 快速上手：3分钟部署Llama-3.2-3B 不需要复杂的环境配置，不需要写代码，只需要简单几步就能开始使用这个强大的文案生成工具。 1.1 找到Ollama模型入口打开你的Ollama界面，在模型选择区域找到入口。通常这里会显示当前可用的模型列表，如果还没有Llama-3.2-3B，需要先下载。 1.2 选择Llama-3.2-3B模型在模型选择下拉菜单中，找到并选择【llama3.2:3b】。这个3B版本的模型在生成质量和运行速度之间取得了很好的平衡，特别适合营销文案生成任务。 1.3 开始使用模型选择模型后，页面下方的输入框就会激活，你可以直接在这里输入你的需求，模型会立即生成相应的文案。 2. 营销文案生成实战案例下面通过几个真实场景，展示Llama-3.2-3B在营销文案生成方面的强大能力。 2.1

LLaMA Factory全攻略：从环境搭建到模型部署的一站式解决方案

LLaMA Factory全攻略：从环境搭建到模型部署的一站式解决方案作为一名IT运维工程师，当公司需要部署一个微调好的大模型时，面对复杂的AI技术栈和依赖环境，往往会感到无从下手。LLaMA Factory正是为解决这一痛点而生的开源工具，它提供了一套完整的低代码解决方案，让你无需深入AI技术细节也能快速完成大模型的微调与部署。本文将带你从零开始，逐步掌握LLaMA Factory的核心使用方法。为什么选择LLaMA Factory？ LLaMA Factory是一个开源的全栈大模型微调框架，它集成了业界广泛使用的微调技术，通过Web UI界面实现零代码操作。对于缺乏AI经验的运维人员来说，它具有以下优势： * 开箱即用：预置了多种流行大模型支持，包括LLaMA、Qwen、ChatGLM等 * 可视化操作：无需编写代码即可完成模型训练、微调和部署 * 资源友好：提供显存优化策略，降低硬件门槛 * 全流程覆盖：从数据准备到模型部署的一站式解决方案这类任务通常需要GPU环境支持，目前ZEEKLOG算力平台提供了包含该镜像的预置环境，可快速部署验证。环境准备

学术家AI（PaperWW）——最新AI论文写作、AI降重、降低aigc的网站

学术家AI（PaperWW）——最新AI论文写作、AI降重、降低aigc的网站一、PaperWW高校合作查重系统——智能学术诚信守护者核心科技，精准查重采用第六代A-自然语言处理技术，基于9亿篇文献的庞大数据池，实现深度语义分析与精准查重，有效识别学术雷同，保障成果原创性。全流程学术支持智能查重：一键检测，快速定位重复内容，提供详细溯源报告；自动降重：AI智能改写，优化表达逻辑，降低重复率同时保留核心观点； AIGC辅助：支持AI生成内容检测与优化，适应学术新趋势；高效工具集：PPT生成、论文速成等功能，助力学术创作提效。高校合作优选专为学术场景设计，覆盖论文、报告、课题材料等多场景检测需求，数据安全可靠，操作便捷，成为高校师生信赖的学术助手。二、PaperWW论文助手——精准查重，轻松降重三版可选，满足全阶段学术需求 �� 版本对比，一键选择免费版 �� 价格：0元/

文章目录

1. 引言

2. 命令使用

2.1 version（显示版本）

2.2 webui（启动 LlamaBoard 界面）

2.3 chat（命令行聊天）

2.4 webchat（网页聊天）

2.5 api（启动 API 服务）

2.6 train（训练模型 ）

2.7 eval（评估模型 ）

2.8 export（导出模型 ）

3. 总结

Read more

Whisper.cpp终极指南：零基础实现快速语音识别的完整方案

Llama-3.2-3B实战：用Ollama生成营销文案

LLaMA Factory全攻略：从环境搭建到模型部署的一站式解决方案

学术家AI（PaperWW）——最新AI论文写作、AI降重、降低aigc的网站

2.6 train（训练模型）

2.7 eval（评估模型）

2.8 export（导出模型）