智谱 GLM-4-9B-Chat 模型部署与认知微调实战
1. 模型简介
GLM-4-9B 是智谱 AI 推出的最新一代预训练模型 GLM-4 系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中,GLM-4-9B 及其人类偏好对齐的版本 GLM-4-9B-Chat 均表现出超越 Llama-3-8B 的卓越性能。除了能进行多轮对话,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理(支持最大 128K 上下文)等高级功能。
2. 环境安装与部署
2.1 服务器准备
建议使用高性能云服务器进行安装部署。创建服务器时选择 AI 框架镜像,磁盘空间建议预留至少 100GB,具体根据模型文件及依赖大小调整。
2.2 基础环境配置
首先安装 git 及 git-lfs 用于下载大文件:
apt install git
apt install git-lfs
2.3 模型下载
从魔搭社区下载 glm-4-9b-chat 模型,文件较大(总计接近 20GB),需确保磁盘空间充足:
git clone https://www.modelscope.cn/ZhipuAI/glm-4-9b-chat.git
同时下载智谱官方封装的模型调用代码:
git clone https://github.com/THUDM/GLM-4.git
项目包含多个 demo,其中 basic_demo 提供基础对话示例,finetune_demo 提供微调示例。
2.4 运行环境配置
使用 conda 管理环境。新建环境并安装依赖:
conda create -n glm4 python=3.12
ipython kernel install --name glm4 --user
conda activate glm4
cd /path/to/GLM-4/basic_demo
pip install -r requirements.txt
若遇到依赖冲突(如 torch 版本问题),可手动修改 requirements.txt 将 torch 版本指定为 torch==2.3.0 后重新安装。
2.5 运行 Web 演示
修改模型路径配置:
MODEL_PATH = os.environ.get('MODEL_PATH', '/root/glm-4-9b-chat')
启动服务:
python trans_web_demo.py
若提示缺少 frpc 文件,需手动下载并重命名至对应目录以支持内网穿透访问。
3. 认知微调实践
为了改变模型的自我认知(例如设定特定的开发者身份或回答风格),可以使用 LoRA 技术进行微调。
3.1 数据集准备
构建指令微调数据集(JSONL 格式)。每条数据应包含 instruction(指令)、input(输入)和 output(输出)。 示例:
{"instruction": "你是谁?", "input"


