LLaMA-Factory 快速入门(五):终端命令实操记录

文章目录

1. 引言

在使用 LLaMA-Factory 进行大模型的微调、评估和部署时,llamafactory-cli 是最常用的命令行工具。它不仅支持命令行对话、训练、评估,还提供了网页界面、API 服务等多种交互方式。

本文将详细介绍 llamafactory-cli 的常用命令及其使用方法,帮助你快速上手并高效完成相关任务。

2. 命令使用

命令功能简述
llamafactory-cli api启动 OpenAI 风格的 API 服务
llamafactory-cli chat在命令行中启动聊天界面
llamafactory-cli eval评估模型
llamafactory-cli export合并 LoRA 适配器并导出模型
llamafactory-cli train训练模型
llamafactory-cli webchat启动网页聊天界面
llamafactory-cli webui启动 LlamaBoard 界面
llamafactory-cli version显示版本信息

2.1 version(显示版本)

功能:显示 LLaMA-Factory 的版本信息,验证安装是否成功

执行命令:

llamafactory-cli version 

执行后的效果如下:

在这里插入图片描述

2.2 webui(启动 LlamaBoard 界面)

功能:启动可视化界面 LlamaBoard,提供图形化操作入口

执行命令:

llamafactory-cli webui 

执行后返回:

在这里插入图片描述


浏览器访问:http://127.0.0.1:7860

2.3 chat(命令行聊天)

功能:接在终端中与模型进行对话,无需启动网页

最小化命令:

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称 

例如:

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1 

执行效果如下:

在这里插入图片描述


当然也可以从模型训练完的chekcpoint启动,命令如下:

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称 

例如:

llamafactory-cli chat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--adapter_name_or_path saves/DeepSeek-R1-1.5B-Distill/lora/cx_666_final_optimized \--template deepseekr1 

2.4 webchat(网页聊天)

功能:启动网页端聊天界面

webchat的功能跟chat命令差不多,只是webchat是给了一个web页面进行对话。最小化命令如下:

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--template 模板名称 

例如:

llamafactory-cli webchat \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1 
在这里插入图片描述


当然也可以从模型训练完的chekcpoint启动webchat,跟chat命令差不多:

llamafactory-cli webchat \--model_name_or_path 模型名称或本地路径 \--adapter_name_or_path 训练后的路径\--template 模板名称 

2.5 api(启动 API 服务)

功能:启动 OpenAI 风格的 API 服务

最小化命令:

llamafactory-cli chat \--model_name_or_path 模型名称或本地路径 \--template 模板名称 

例如执行:

llamafactory-cli api \--model_name_or_path /Users/yanglinwei/.cache/modelscope/hub/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B \--template deepseekr1 

可以看到输出了如下信息:

在这里插入图片描述


浏览器访问:http://localhost:8000/docs

在这里插入图片描述


可以看到开放了3种API,分别是:

接口名称路径说明
List Models/v1/models列出当前可用的模型,用于查看可选择的模型信息
Create Chat Completion/v1/chat/completions生成聊天回复,用于对话或文本生成
Create Score Evaluation/v1/score/evaluation对模型输出进行评分或评估,用于检测生成内容质量

直接执行ListModels列出当前可用的模型,可以看见返回:

在这里插入图片描述


执行Create Chat Completion,示例请求内容如下:

{"model":"deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B", "messages":[{"role":"user", "content":"你好,可以自我介绍一下吗?"}], "do_sample": true, "temperature":0.7, "top_p":0.9, "n":1, "max_tokens":512, "stream":false}

可以看到返回:

在这里插入图片描述

2.6 train(训练模型 )

功能:启动训练流程,对模型进行微调

详情可以参考:《LLaMA-Factory 快速入门(一):Mac 下大模型微调与部署全流程》

2.7 eval(评估模型 )

功能::对训练后的模型进行性能评估

详情可以参考:《LLaMA-Factory 快速入门(一):Mac 下大模型微调与部署全流程》

2.8 export(导出模型 )

功能:合并 LoRA 适配器并导出最终模型

详情可以参考:《LLaMA-Factory 快速入门(一):Mac 下大模型微调与部署全流程》

3. 总结

本文详细介绍了 LLaMA-Factory 的命令行工具 llamafactory-cli 的常用功能,包括版本检查、命令行聊天、网页聊天、可视化界面、API 服务,以及训练、评估、导出等核心操作。

  • 可以先从 chat / webchat 开始,快速体验模型效果;
  • 如果需要部署服务,建议使用 api 模式;
  • 完整训练流程中,train → eval → export 是必经的三个步骤。

通过灵活使用这些命令,大家可以快速搭建起属于自己的大模型微调与应用环境 。

Read more

基于DamoFD-0.5G的AR虚拟试妆系统

基于DamoFD-0.5G的AR虚拟试妆系统 1. 引言 想象一下这样的场景:你在网上看中了一支口红,但不确定这个颜色是否适合自己。传统的网购只能靠想象,或者看别人的试色图,但每个人的肤色、唇形都不一样,效果可能天差地别。 现在有了基于DamoFD-0.5G的AR虚拟试妆系统,这个问题就迎刃而解了。你只需要打开手机摄像头,系统就能实时检测到你的人脸,精准定位五官,然后把口红、眼影、腮红等彩妆效果叠加到你的脸上,让你在购买前就能看到真实的上妆效果。 这种技术不仅能让购物体验更加直观,还能节省大量试妆时间。对于美妆品牌来说,这也是提升用户 engagement 的利器。今天我们就来深入探讨如何利用DamoFD-0.5G这个人脸检测模型,构建一个高精度的AR虚拟试妆系统。 2. DamoFD-0.5G的技术优势 DamoFD-0.5G是达摩院推出的一款轻量级人脸检测模型,只有0.5G的计算量,但在精度上却毫不妥协。它在WiderFace数据集上的hard集精度达到了71.03%,比同级别的其他模型高出2.5个百分点。 这个模型最大的特点是能够同时输出人脸 bounding

Flutter 组件 bip340 适配鸿蒙 HarmonyOS 实战:次世代 Schnorr 签名,为鸿蒙 Web3 与隐私计算筑牢加密防线

Flutter 组件 bip340 适配鸿蒙 HarmonyOS 实战:次世代 Schnorr 签名,为鸿蒙 Web3 与隐私计算筑牢加密防线

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 bip340 适配鸿蒙 HarmonyOS 实战:次世代 Schnorr 签名,为鸿蒙 Web3 与隐私计算筑牢加密防线 前言 在鸿蒙(OpenHarmony)生态迈向去中心化金融(DeFi)、隐私通讯及安全资产管理等高阶安全场景的背景下,如何实现更高性能、更具扩展性且抗攻击能力的数字签名架构,已成为决定应用闭环安全性的“压舱石”。在鸿蒙设备这类强调分布式鉴权与芯片级安全(TEE/SE)的移动终端上,如果依然沿用传统的 ECDSA 签名算法,由于由于其固有的可延展性风险与高昂的聚合验证成本,极易由于由于在大规模节点验证时的 CPU 负载过高导致交互滞后。 我们需要一种能够实现签名线性聚合、计算逻辑极简且具备原生抗延展性的密码学方案。 bip340 为 Flutter 开发者引入了比特币 Taproot 升级的核心——Schnorr 签名算法。它不仅在安全性上超越了传统标准,更通过其线性的数学特性,

从零构建你的量化交易系统:通达信API与Python实战指南

从零构建你的量化交易系统:通达信API与Python实战指南 量化交易正逐渐成为现代投资领域的重要工具,它通过数学模型和计算机程序来执行交易决策,能够有效减少人为情绪干扰,提高交易效率。对于想要进入这一领域的开发者来说,掌握如何利用通达信API和Python构建量化交易系统是极具价值的技能。 1. 量化交易基础与环境搭建 在开始构建量化交易系统之前,我们需要先了解一些基本概念并搭建好开发环境。量化交易的核心是通过数学模型和统计方法分析市场数据,制定交易策略,并通过计算机程序自动执行交易。 1.1 Python环境配置 Python是量化交易领域最受欢迎的编程语言之一,拥有丰富的金融数据分析库。建议使用Anaconda来管理Python环境: # 创建专用环境 conda create -n quant python=3.8 conda activate quant # 安装基础包 pip install numpy pandas matplotlib 1.2 通达信API接入准备 通达信是国内广泛使用的证券分析软件,其API接口允许开发者获取行情数据和执行交易指令。

机器人3D环境感知革命:RTAB-Map全功能深度解析

机器人3D环境感知革命:RTAB-Map全功能深度解析 【免费下载链接】rtabmap_rosRTAB-Map's ROS package. 项目地址: https://gitcode.com/gh_mirrors/rt/rtabmap_ros 还在为机器人无法精准感知环境而烦恼吗?RTAB-Map作为基于ROS的实时外观建图系统,正彻底改变机器人的环境理解能力。这个强大的开源工具让机器人能够像人类一样"看懂"周围世界,实现从简单移动到智能导航的质的飞跃。 🎯 为什么RTAB-Map成为机器人视觉SLAM的首选? 突破性的循环闭合检测技术是RTAB-Map的核心优势。想象一下,当你的机器人在探索过程中重新回到起点时,系统能够智能识别并修正累积误差,保证地图的长期一致性。这种能力让RTAB-Map在长期自主导航中表现卓越。 多传感器深度融合能力让RTAB-Map适配各种硬件配置: * RGB-D深度相机(Intel RealSense、Kinect系列) * 立体视觉系统(ZED、OAK-D) * 3D激光雷达(Velodyne、Ouster) * 惯性测量单元I