LangChain-Chatchat
概述
LangChain-Chatchat 是一个基于 ChatGLM 大语言模型与 Langchain 应用框架实现的开源、可离线部署的检索增强生成 (RAG) 大模型的本地知识库问答应用项目。
GitHub:https://github.com/chatchat-space/Langchain-Chatchat
实现原理
本项目实现原理过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k 个 -> 匹配出的文本作为上下文和问题一起添加到 prompt 中 -> 提交给 LLM 生成回答。
开发环境准备
软件要求
使用 Ubuntu 系统,其他系统可能出现系统兼容性问题。
Linux Ubuntu 22.04.5 kernel version 6.7
最低要求
该要求仅针对标准模式,轻量模式使用在线模型,不需要安装 torch 等库,也不需要显卡即可运行。
Python 版本:>= 3.8(很不稳定), < 3.11
CUDA 版本:>= 12.1
推荐要求
开发者在以下环境下进行代码调试,在该环境下能够避免最多环境问题。
Python 版本 == 3.10.12
CUDA 版本:== 12.3
硬件要求
如果为了体验使用该项目,可以使用线上模型,不需要太高的硬件要求。
如果想要顺利在 GPU 运行本地模型的 int4 量化版本,至少需要以下的硬件配置。
ChatGLM2-6B & LLaMA-7B
最低显存要求:7GB
推荐显卡:RTX 3060, RTX 2060
LLaMA-13B
最低显存要求:11GB
推荐显卡:RTX 2060 12GB, RTX 3060 12GB, RTX 3080, RTX A2000
Qwen-14B-Chat
最低显存要求:13GB


