Langchain-Chatchat 本地知识库部署与使用指南

Langchain-Chatchat 本地知识库部署与使用指南 | 极客日志

Linux Ubuntu 22.04.5 kernel version 6.7

Python 版本：>= 3.8, < 3.11
CUDA 版本：>= 12.1

Python 版本 == 3.10.12
CUDA 版本：== 12.3

最低显存要求：7GB
推荐显卡：RTX 3060, RTX 2060

最低显存要求：11GB
推荐显卡：RTX 2060 12GB, RTX 3060 12GB, RTX 3080, RTX A2000

最低显存要求：13GB
推荐显卡：RTX 3090

最低显存要求：22GB
推荐显卡：RTX A5000, RTX 3090, RTX 4090, RTX 6000, Tesla V100, RTX Tesla P40

最低显存要求：40GB
推荐显卡：A100, A40, A6000

若使用 int8 推理，则显存大致为 int4 推理要求的 1.5 倍
若使用 fp16 推理，则显存大致为 int4 推理要求的 2.5 倍
数据仅为估算，实际情况以 nvidia-smi 占用为准。
同时，Embedding 模型将会占用 1-2G 的显存，历史记录最多会占用数 G 显存，因此，需要多冗余一些显存。
内存最低要求：内存要求至少应该比模型运行的显存大。

git clone https://github.com/chatchat-space/Langchain-Chatchat.git
cd Langchain-Chatchat

conda create -n chat python=3.10
conda activate chat

pip install -r requirements.txt 
pip install -r requirements_api.txt
pip install -r requirements_webui.txt

python copy_config_example.py

python init_database.py --recreate-vs

python init_database.py --create-tables

python startup.py -a

OpenAI API Server: http://127.0.0.1:20000/v1
Chatchat API Server: http://127.0.0.1:7861
Chatchat WEBUI Server: http://0.0.0.0:8501

python server/api.py

streamlit run webui.py

构建镜像
```
docker build -t langchain-chatchat .
```

运行容器

docker run -d -p 8501:8501 -p 7861:7861 -v $(pwd)/models:/root/models langchain-chatchat

注意挂载 models 目录以避免每次重新下载模型。

import requests

url = "http://127.0.0.1:7861/api/v1/chat"
data = {
    "question": "什么是 Langchain？",
    "chat_history": [],
    "knowledge_base_id": "default_kb"
}

response = requests.post(url, json=data)
print(response.json())

python init_database.py --recreate-vs

cannot import name 'Doc' from 'typing_extensions'

pip install typing_extensions==4.8.0

python startup.py -a

OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.

import os
os.environ['KMP_DUPLICATE_LIB_OK']='True'

python startup.py -a

OSError: We couldn't connect to 'https://huggingface.co' to load this file...

# 统一存放模型位置
MODEL_ROOT_PATH = "/root/models"

# 选用的 Embedding 名称
EMBEDDING_MODEL = "bge-large-zh"

# 要运行的 LLM 名称
LLM_MODELS = ["chatglm3-6b", "zhipu-api", "openai-api"]

MODEL_PATH = {
    "embed_model": {
        "bge-large-zh": "bge-large-zh",
    },
    "llm_model": {
        "chatglm3-6b": "chatglm3-6b",
    },
}

Langchain-Chatchat 本地知识库部署与使用指南

Langchain-Chatchat

概述

实现原理

开发环境准备

软件要求

硬件要求

部署

拉取仓库

创建虚拟环境

安装全部依赖

初始化配置文件

模型下载

初始化知识库

启动项目

访问 Web UI

API 服务

Web UI 服务

使用

对话功能

知识库管理

文件对话

搜索引擎问答

Docker 部署方式（补充）

API 调用示例（补充）

异常集合

异常 1

异常 2

异常 3

常见网络与端口问题

更多推荐文章

相关免费在线工具

Langchain-Chatchat 本地知识库部署与使用指南

Langchain-Chatchat

概述

实现原理

开发环境准备

软件要求

硬件要求

部署

拉取仓库

创建虚拟环境

安装全部依赖

初始化配置文件

模型下载

初始化知识库

启动项目

访问 Web UI

API 服务

Web UI 服务

使用

对话功能

知识库管理

文件对话

搜索引擎问答

Docker 部署方式（补充）

API 调用示例（补充）

异常集合

异常 1

异常 2

异常 3

常见网络与端口问题

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具