LLaMA-Factory 快速入门（五）：终端命令实操记录

优质文章学习记录

06 Apr 2026 — 5 min read

文章目录

1. 引言
2. 命令使用
3. 总结

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时，llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估，还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法，帮助你快速上手并高效完成相关任务。

2. 命令使用

命令	功能简述
llamafactory-cli api	启动 OpenAI 风格的 API 服务
llamafactory-cli chat	在命令行中启动聊天界面
llamafactory-cli eval	评估模型
llamafactory-cli export	合并 LoRA 适配器并导出模型
llamafactory-cli train	训练模型
llamafactory-cli webchat	启动网页聊天界面
llamafactory-cli webui	启动 LlamaBoard 界面
llamafactory-cli version	显示版本信息

2.1 version（显示版本）

功能：显示 LLaMA-Factory 的版本信息，验证安装是否成功

执行命令：

llamafactory-cli version

执行后的效果如下：

2.2 webui（启动 LlamaBoard 界面）

功能：启动可视化界面 LlamaBoard，提供图形化操作入口

执行命令：

llamafactory-cli webui

执行后返回：

浏览器访问：http://127.0.0.1:7860

2.3 chat（命令行聊天）

功能：接在终端中与模型进行对话，无需启动网页

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

执行效果如下：

当然也可以从模型训练完的chekcpoint启动，命令如下：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

例如：

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1

2.4 webchat（网页聊天）

功能：启动网页端聊天界面

webchat的功能跟chat命令差不多，只是webchat是给了一个web页面进行对话。最小化命令如下：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如：

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

当然也可以从模型训练完的chekcpoint启动webchat，跟chat命令差不多：

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称

2.5 api（启动 API 服务）

功能：启动 OpenAI 风格的 API 服务

最小化命令：

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称

例如执行：

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1

可以看到输出了如下信息：

浏览器访问：http://localhost:8000/docs

可以看到开放了3种API，分别是：

接口名称	路径	说明
List Models	`/v1/models`	列出当前可用的模型，用于查看可选择的模型信息
Create Chat Completion	`/v1/chat/completions`	生成聊天回复，用于对话或文本生成
Create Score Evaluation	`/v1/score/evaluation`	对模型输出进行评分或评估，用于检测生成内容质量

直接执行ListModels列出当前可用的模型，可以看见返回：

执行Create Chat Completion，示例请求内容如下：

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好，可以自我介绍一下吗？"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回：

2.6 train（训练模型）

功能：启动训练流程，对模型进行微调

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.7 eval（评估模型）

功能：：对训练后的模型进行性能评估

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

2.8 export（导出模型）

功能：合并 LoRA 适配器并导出最终模型

详情可以参考：《LLaMA-Factory 快速入门（一）：Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能，包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务，以及训练、评估、导出等核心操作。

可以先从 chat / webchat 开始，快速体验模型效果；
如果需要部署服务，建议使用 api 模式；
完整训练流程中，train → eval → export 是必经的三个步骤。

通过灵活使用这些命令，大家可以快速搭建起属于自己的大模型微调与应用环境。

Whisper-large-v3多任务并行：同一服务同时运行转录/翻译/摘要三模式

Whisper-large-v3多任务并行：同一服务同时运行转录/翻译/摘要三模式基于 OpenAI Whisper Large v3 构建的多语言语音识别 Web 服务，支持 99 种语言自动检测，可同时运行转录、翻译和摘要三种处理模式。 1. 项目概述与核心价值 Whisper-large-v3 是 OpenAI 推出的强大语音识别模型，拥有 15 亿参数，支持 99 种语言的自动检测与转录。本项目基于该模型二次开发，构建了一个支持多任务并行的 Web 服务，可以在同一服务中同时处理语音转录、文本翻译和内容摘要三种任务。传统语音识别服务的痛点： * 需要部署多个服务处理不同任务 * 数据在不同系统间流转效率低 * 维护成本高，资源利用率低本方案的创新价值： * 单服务集成三大核心功能 * 减少数据传输开销，提升处理效率 * 统一接口简化开发集成 * 最大化利用 GPU 资源通过这个方案，你可以用一段音频输入，

理解 IDE 调用大模型（Cursor / Claude Code / Copilot / OpenClaw / Agent IDE）的 session

一、Session 在 IDE 里的真实含义在普通 ChatGPT 对话中： Session ≈ 一段聊天但在 IDE 中： Session ≈ 当前开发工作空间的认知状态它通常包含： ① 对话历史（Conversation Memory）你之前说过什么： * 修改哪个模块 * 当前目标 * 已做决策 * 技术约束模型通过这些推断你下一步意图。 ② 工程上下文（Code Context） IDE 会持续注入： * 当前打开文件 * 最近编辑文件 * git diff * 报错日志 * terminal 输出 * workspace 结构所以 session 实际上是：语言上下文 + 代码上下文 + 操作历史 ③ Agent 状态（关键）在 Agent

微软 Copilot Cowork 深度解析：用 Kotlin + 147API 手搓一个 AI Agent

微软最近发布的 Copilot Cowork 在技术圈炸开了锅。它变了。它不再是那个只会补全代码的插件，而是变成了你的 “Coworker”（同事）。基于 Anthropic 的 Claude 构建，它现在能像真人一样处理复杂任务。作为开发者，我们不仅要会用，更要懂得背后的原理。今天我们就来拆解一下 Copilot Cowork 的核心逻辑，并教你如何利用 Kotlin 和 147API 构建一个属于自己的简易 AI Agent。从 Chatbot 到 Agent 传统的 Copilot 就像一个实习生，你给它一个指令，它执行一个动作。而 Copilot Cowork 更像是一个成熟的合作伙伴。它具备了感知（Perception）、规划（Planning）和执行（Execution）

在 Mac Mini M4 上本地跑大模型（Ollama + Llama + ComfyUI + Stable Diffusion ｜ Flux）

Mac Mini M4 配备了苹果自家研发的 M1/M2/M4 芯片，具有强大的处理能力，能够支持本地跑一些大模型，尤其是在使用如 Ollama、Llama、ComfyUI 和 Stable Diffusion 这类 AI 相关工具时，性能表现非常好。本教程将指导你如何在 Mac Mini M4 上本地部署并运行这些大模型，涵盖从环境搭建到使用的全流程。一、准备工作 1. 确保系统更新确保你的 macOS 版本已更新到最新的版本（例如 macOS 13.0 以上），这将确保兼容性和性能。安装 Homebrew（macOS 包管理工具） Homebrew 是 macOS 上非常流行的包管理工具，它帮助你方便地安装各种软件。在终端中输入以下命令来安装

文章目录

1. 引言

2. 命令使用

2.1 version（显示版本）

2.2 webui（启动 LlamaBoard 界面）

2.3 chat（命令行聊天）

2.4 webchat（网页聊天）

2.5 api（启动 API 服务）

2.6 train（训练模型 ）

2.7 eval（评估模型 ）

2.8 export（导出模型 ）

3. 总结

Read more

Whisper-large-v3多任务并行：同一服务同时运行转录/翻译/摘要三模式

理解 IDE 调用大模型（Cursor / Claude Code / Copilot / OpenClaw / Agent IDE） 的 session

微软 Copilot Cowork 深度解析：用 Kotlin + 147API 手搓一个 AI Agent

在 Mac Mini M4 上本地跑大模型（Ollama + Llama + ComfyUI + Stable Diffusion ｜ Flux）

2.6 train（训练模型）

2.7 eval（评估模型）

2.8 export（导出模型）

理解 IDE 调用大模型（Cursor / Claude Code / Copilot / OpenClaw / Agent IDE）的 session