离线部署 ChatGLM3 大模型实现本地 AI 聊天
在特定的情况下,为了保证信息安全的同时还能享受到 AIGC 大模型带来的乐趣和功能,离线部署是一个真正可用的方案。本文将详细介绍如何在本地搭建清华大学的 ChatGLM3 大模型。
硬件与环境要求
大模型对计算资源有较高要求。建议配置如下:
- CPU:多核高性能处理器。
- 显卡 (GPU):显存至少 13GB+,推荐 NVIDIA 显卡(支持 CUDA)。
- 内存 (RAM):基本需要 32GB+。
ChatGLM3 系列包含三种主要版本:
- ChatGLM3-6B-Base:基础预训练模型,适合微调。
- ChatGLM3-6B:通用对话模型,最常用。
- ChatGLM3-6B-32K:长上下文版本,适合处理长文档,但资源消耗更大。
一般推荐使用 ChatGLM3-6B 普通模型进行日常使用,如果配置较高可尝试 32K 版本。
环境准备
在开始之前,请确保系统已安装以下基础环境。如果未布置好,请参考相关 Ubuntu 22.04 驱动及 CUDA 安装指南。
1. 安装 Git LFS
由于模型文件较大,需要使用 Git LFS 进行下载管理。
git lfs install
2. 创建 Conda 虚拟环境
建议使用 Python 3.10 版本。
conda create --name chatglm3 python=3.10
conda activate chatglm3
项目克隆与模型下载
1. 克隆项目
从官方 GitHub 仓库克隆代码。
git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3
默认项目中不包含模型权重,仅包含示例代码和接口。
2. 下载模型权重
模型文件约 11.6GB,建议提前下载以避免运行时网络波动影响体验。提供两个下载源:
方式一:HuggingFace
git clone https://huggingface.co/THUDM/chatglm3-6b
方式二:ModelScope (国内访问更稳定)
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git
下载完成后,将模型文件夹移动到项目根目录或指定路径。
依赖安装与配置
1. 安装 Python 依赖
进入项目主目录,安装基础依赖包。建议使用国内镜像加速。
pip install -r requirements.txt -i https://mirror.sjtu.edu.cn/pypi/web/simple
如需验证安装情况,可使用:
pip list
pip show openai


