利用 Ollama + RAGFlow 部署千问大模型构建个人知识库 AI 智能体
将开源的大语言预训练模型部署到用户设备上进行推理应用,特别是结合用户专业领域知识库构建 AI 应用,让 AI 在回答时更具有专业性。目前已有许多成熟的应用方案,支持大模型本地化部署的平台及工具包括 Ollama、vLLM、LangChain、Ray Serve 等,大大简化了模型的部署工作并提供全生命周期管理。针对知识库构建,需要能处理多种格式文档(doc/pdf/txt/xls 等)的工具,实现文本自动分割、向量化处理及本地检索增强生成(RAG)。常用工具包括 RAGFlow、MaxKB、AnythingLLM、FastGPT、Dify、Open WebUI 等。
本文将采用 Ollama + RAGFlow 方式进行搭建,系统架构如下:

1. 安装 Ollama
Ollama 是一个开源的大型语言模型服务工具,旨在帮助用户在本地环境中部署和运行大型语言模型。其核心功能是提供简单、灵活的方式,将复杂的 AI 模型从云端迁移到本地机器上,简化大型语言模型在本地环境中的运行和管理。
(1) 执行安装命令
curl -fsSL https://ollama.com/install.sh | sh
在安装过程中,Ollama 会识别相应的 GPU 加速卡。若未识别相应设备,则使用 CPU 模式。
GPU 模式提示: "NVIDIA GPU installed"

CPU 模式提示: "No NVIDIA/AMD GPU detected. Ollama will run in CPU-only mode"

(2) 查看 Ollama 状态
sudo systemctl status ollama

(3) 设置 Ollama 环境变量
为了后续在 RAGFlow 容器环境下配置连接时能够正常连接 Ollama,需要修改服务配置文件。
sudo vi /etc/systemd/system/ollama.service
增加 Environment="OLLAMA_HOST=0.0.0.0:11434"。






























