使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南 | 极客日志

编程语言Node.jsAI算法

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

介绍如何利用 Ollama 和 AnythingLLM 在本地构建私有 AI 知识库。通过部署开源大语言模型、嵌入模型及向量数据库，实现文档的智能问答（RAG）。涵盖环境安装、模型选择、工作区配置、文档解析及 API 调用等全流程，确保数据隐私与离线可用。重点讲解了 Docker 部署方式、常见错误排查及性能优化策略，适合希望掌握本地 AI 应用的开发者参考。

蓝绿部署发布于 2025/2/6更新于 2026/7/2540 浏览

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

在本地电脑上运行大语言模型（LLM）已不再是高门槛操作。随着技术的迭代，利用 Ollama 和 AnythingLLM 可以轻松构建自己的本地知识库，实现数据隐私保护与离线智能问答。本文将详细介绍从环境部署到 RAG（检索增强生成）应用的全流程。

一、技术架构原理

构建本地 AI 知识库主要涉及三个核心组件：

大语言模型（LLM）：负责理解自然语言并生成回答。本地部署需考虑显存与内存资源。
嵌入模型（Embedding Model）：将文本转化为向量表示，用于语义搜索。常见的有 Nomic Embed Text、BGE 等。
向量数据库（Vector Database）：存储和管理向量数据，支持高效的相似度检索。AnythingLLM 默认使用 LanceDB，也支持 Chroma、Milvus 等。

二、环境准备与 Ollama 安装

Ollama 是运行本地大模型的神器，支持 Windows、Mac 及 Linux 系统。

1. 硬件要求

7B 模型：至少 8GB 内存。
13B 模型：建议 16GB 内存。
70B 模型：建议 64GB 内存或配备高性能 GPU。

2. 安装步骤

访问 ollama.com 下载对应系统的安装包。安装完成后，打开终端验证版本：

ollama -V

若显示版本号，说明安装成功。

3. 启动服务

Ollama 默认后台运行，但如需确认状态可执行：

ollama serve

验证端口是否开放：

curl http://localhost:11434

若返回 Ollama is running，则服务正常。

三、模型管理与下载

Ollama 提供了丰富的开源模型库。通过命令行即可拉取模型。

1. 常用模型推荐

Llama 3：Meta 出品，综合性能强。
Gemma：Google 出品，轻量级且高效。
Mistral：推理能力出色。

2. 拉取与运行

以 Llama 3 为例，拉取 8B 版本：

ollama pull llama3:8b

运行模型进入交互模式：

ollama run llama3:8b

首次运行会自动下载模型权重。下载完成后，即可进行对话测试。

四、AnythingLLM 部署与配置

AnythingLLM 是一个全栈应用程序，支持私有 ChatGPT 构建，无需妥协即可在本地运行。

1. 下载与启动

访问 useanything.com/download 获取桌面版或 Docker 镜像。

Docker 部署（推荐）

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name anything-llm --restart always useanything/anythingllm-server:latest

curl -X POST http://localhost:3000/api/v1/workspaces/{workspaceId}/chat \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"message": "请总结上传的文档内容"}'

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

一、技术架构原理

二、环境准备与 Ollama 安装

1. 硬件要求

2. 安装步骤

3. 启动服务

三、模型管理与下载

1. 常用模型推荐

2. 拉取与运行

四、AnythingLLM 部署与配置

1. 下载与启动

Docker 部署（推荐）

更多推荐文章

相关免费在线工具

2. 基础配置

3. 工作区管理

五、文档入库与 RAG 问答

1. 文档导入

2. 问答模式

3. 引用功能

六、高级优化与 API 集成

1. 性能调优

2. API 调用

七、常见问题排查

1. 连接错误

2. 显存不足

3. 中文支持

八、总结

更多推荐文章

相关免费在线工具

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

使用 Ollama 与 AnythingLLM 搭建本地 AI 知识库指南

一、技术架构原理

二、环境准备与 Ollama 安装

1. 硬件要求

2. 安装步骤

3. 启动服务

三、模型管理与下载

1. 常用模型推荐

2. 拉取与运行

四、AnythingLLM 部署与配置

1. 下载与启动

Docker 部署（推荐）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 基础配置

3. 工作区管理

五、文档入库与 RAG 问答

1. 文档导入

2. 问答模式

3. 引用功能

六、高级优化与 API 集成

1. 性能调优

2. API 调用

七、常见问题排查

1. 连接错误

2. 显存不足

3. 中文支持

八、总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具