本地个人知识库搭建教程:支持 GPT4、Llama3、Kimi 等多种大模型
本文介绍了基于 Docker 部署 MaxKB 构建本地个人知识库的完整流程。通过配置本地大模型如 Llama3 与知识库关联,实现文档内容的实时搜索与问答。方案确保数据隐私安全,无需联网即可运行,适用于办公效率提升及敏感数据处理场景。

本文介绍了基于 Docker 部署 MaxKB 构建本地个人知识库的完整流程。通过配置本地大模型如 Llama3 与知识库关联,实现文档内容的实时搜索与问答。方案确保数据隐私安全,无需联网即可运行,适用于办公效率提升及敏感数据处理场景。

部署本地知识库,可以借助大模型能力,自动检索工作学习文档,实现对文档内容的实时搜索与问答。
因为大模型、知识库和文档全部运行在本地,所以公司内的业务数据不会泄密,个人隐私不会泄密。在保证安全的同时,办公效率将显著提升。
搭建完成后,可实现的效果如下:

MaxKB 是一个在本地搭建自己知识库问答的系统。主要优势包括:
如果尚未安装 Docker,请先完成安装。安装完成后,执行以下命令获取 MaxKB 的镜像到本地:
docker pull maxkb/maxkb:latest
下面是正在拉取镜像的过程示意:

整个 MaxKB 的镜像大小约为 2GB。
安装完成后,打开 Docker Desktop,按照以下步骤操作:


如果在 Ports 设置中缺少端口映射,可以尝试重启 Docker 服务或电脑后再次进入,通常会出现该选项。

按照下图填写相关参数:

注意: 先不要关闭这个窗口,稍后还需要填入一些信息。
接下来,在电脑上创建一个存放知识库数据的文件夹,并记住该路径。返回 Docker 界面,找到 Volumes 输入框(对应图中的位置),填入刚才的知识库路径。例如:
/Users/zhenguo/Documents/words
随后在 Container path 输入框中填入 /var/lib/postgresql/data,这是固定不变的配置。

最后点击 Run 按钮,这样一个 MaxKB 容器就搭建完毕了!
浏览器打开链接 http://127.0.0.1:8080,即可看到 MaxKB 应用界面。

首次登录需要提供账号和密码。MaxKB 默认账号通常为 admin,密码为 MaxKB123456(具体请参考官方文档)。登录后,建议立即更改登录用户名和密码。
创建应用程序的界面如下:

选择知识库导航,点击 创建知识库 按钮。


知识库系统主要有两种类型:
根据需求选择 通用型。点击进入 选择文件夹,上传 Python 副业代码文件、说明文档等。支持的数据格式包括 txt、word、pdf、ppt 等。确定需要上传的文档后,点击右下角的'创建并导入'按钮。

为了加快接入速度,可先选择一部分文件作为测试。MaxKB 支持直接读取一个文件夹,这样更方便。

点击右下角 创建并导入。

导入后,系统会开始处理分析和接入。文档导入时间长短取决于文档内容的多少,内容越多,导入时间越长。

在 MaxKB 网站内的应用界面中,点击 系统设置,然后进入 模型设置 界面。

可以看到这里支持的大模型比较多。我们以 Ollama + Llama3 配置为例。
首先确保本地已安装 Ollama 并拉取了 Llama3 模型。在终端执行以下命令:
ollama serve
ollama pull llama3
回到 MaxKB 模型设置界面,点击添加模型。按照说明填写配置,然后点击添加:

添加成功后,会显示下面界面:

回到 MaxKB 主界面,点击 应用,然后 创建应用。
填写 应用名称、应用描述。AI 模型 这里,选择刚才创建的 MaxKB 里的 Llama3 模型。

记得勾选关联知识库的选项,这样大模型和我们本地知识库就关联起来了:

最后点击 创建 按钮,就会看到下面的应用:

以上完整步骤,根据本文步骤,就可以实现文章开始的问答效果。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online
将 Markdown(GFM)转为 HTML 片段,浏览器内 marked 解析;与 HTML转Markdown 互为补充。 在线工具,Markdown转HTML在线工具,online