Mac 本地部署大模型及 LangChain 应用实践

介绍

随着 ChatGPT 的横空出世，国内互联网大厂、创业公司纷纷加入 AIGC 赛道，不断推出各种大模型。这些模型由于规模庞大、结构复杂，往往包含数十亿至数千亿的参数。在训练阶段，一般需要使用高效能的 GPU 集群训练数十天；在推理阶段，也需要高效能的 GPU 集群才能支撑一定量级的并发请求且实时返回。目前也有不少公司推出了规模相对较小但效果仍有一定优势的大模型，可以在消费级的单卡 GPU 上进行推理、甚至训练。本文尝试在普通的 Macbook Pro 上部署大模型开源方案，实现自然语言问答和对话等功能。

配置

所使用的 Macbook Pro 配置如下：

机型：Macbook Pro（14 英寸，2021 年）
芯片：Apple M1 Pro
内存：16G
系统：macOS Monterey，12.6.2

前置条件

首先默认本地已安装 macOS 的软件包管理工具 Homebrew。

Git

安装 Git：

brew install git

由于使用 git 命令下载的模型文件较大，因此还需要安装 Git Large File Storage：

brew install git-lfs

Conda

Conda 是一个依赖和环境管理工具，支持的语言包括 Python、R、Ruby 等，目前在 Python 语言生态中得到广泛应用。通过它可以创建、管理多个相互独立、隔离的 Python 环境。MiniConda 是 Conda 的免费、最小可用版本。下载并安装 MiniConda：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-MacOSX-arm64.sh -b -p $HOME/miniconda
source ~/miniconda/bin/activate

ChatGLM-6B

介绍

ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型，基于 General Language Model（GLM）架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（INT4 量化级别下最低只需 6GB 显存）。ChatGLM-6B 使用了和 ChatGLM 相同的技术，针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。而 ChatGLM-6B-INT4 是 ChatGLM-6B 量化后的模型权重。具体的，ChatGLM-6B-INT4 对 ChatGLM-6B 中的 28 个 GLM Block 进行了 INT4 量化，没有对 Embedding 和 LM Head 进行量化。量化后的模型理论上 6G 显存（使用 CPU 即内存）即可推理，具有在嵌入式设备上运行的可能。

部署

创建并激活环境：

conda create --name chatglm python=3.9
conda activate chatglm

下载 ChatGLM-6B 源码：

cd ~/workspace/
git clone https://github.com/THUDM/ChatGLM-6B

安装依赖：

cd ~/workspace/ChatGLM-6B
pip install -r requirements.txt

下载 ChatGLM-6B INT4 量化的模型权重 ChatGLM-6B-INT4：

cd ~/workspace/models/
git lfs install
git clone https://huggingface.co/THUDM/chatglm-6b-int4

Mac 本地部署大模型及 LangChain 应用实践

介绍

配置

前置条件

Git

Conda

ChatGLM-6B

介绍

部署

更多推荐文章

相关免费在线工具

ChatGLM2-6B

介绍

部署

LangChain

介绍

部署

安装依赖

Model

Chain

LLMChain

RetrievalQA

SQLDatabaseChain

Agent

langchain-ChatGLM

介绍

部署

结语

更多推荐文章

相关免费在线工具

Mac 本地部署大模型及 LangChain 应用实践

介绍

配置

前置条件

Git

Conda

ChatGLM-6B

介绍

部署

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

ChatGLM2-6B

介绍

部署

LangChain

介绍

部署

安装依赖

Model

Chain

LLMChain

RetrievalQA

SQLDatabaseChain

Agent

langchain-ChatGLM

介绍

部署

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具