前提需要 Docker 环境,本文基于 Docker 安装 Milvus 向量数据库。后台通过 Java 项目启动,Java 版本 17。
技术组件核心作用与优势
| 组件 | 核心作用 | 核心优势 |
|---|---|---|
| Ollama | 本地运行开源大模型(对话生成、文本向量化) | 1. 轻量便捷,一键部署,无需复杂的模型环境配置; |
- 离线可用,支持 Qwen、Llama、Mistral 等多款开源模型;
- 支持自定义模型,可嵌入固定角色与业务规则;
- 无调用额度限制,零成本使用。 | | Milvus | 存储与检索高维向量数据(知识库核心载体) | 1. 专为向量检索设计,性能远超通用数据库,支持百万级向量快速检索;
- 支持数据持久化,重启服务后知识库数据不丢失;
- 提供可视化工具 Attu,方便管理向量集合与数据;
- 可横向扩展,从单机版平滑升级到分布式集群,满足业务增长需求。 | | Spring AI | 基于 Spring Boot,简化大模型 / 向量库整合 | 1. 封装 Ollama 调用,无需手写 HTTP 请求,一行代码完成文本向量化与对话生成;
- 与 Spring Boot 无缝集成,支持配置化管理模型参数,自动注入客户端;
- 提供统一的 RAG 流程支撑,降低大模型项目开发成本;
- 支持扩展多种大模型 / 向量库,便于后续技术选型替换。 | | Apache Tika | 解析 PDF/Word 等多种格式文档(辅助构建知识库) | 1. 支持几乎所有主流文档格式,无需单独开发各格式解析逻辑;
- 轻量高效,能快速提取文档中的纯文本内容,用于后续向量化。 |
步骤 1:Ollama 安装与必备模型下载
Ollama 是本地智能体的「大脑」,负责将文本转换为向量(供 Milvus 存储)和基于检索结果生成自然语言回答,先完成它的安装与模型下载。
1. 跨平台安装 Ollama
Ollama 支持全平台安装,步骤简单,无需额外配置:
- Windows 系统:
- 访问 Ollama 官方下载地址,点击下载 Windows 版本安装包(.exe 格式);
- 双击安装包,按照提示下一步安装(默认勾选「Add Ollama to PATH」,无需手动修改);
- 安装完成后,Ollama 会自动在后台启动服务,无需手动执行命令。
- macOS 系统:
- 访问 Ollama 官方下载地址,下载 macOS 版本安装包(.dmg 格式);
- 双击安装包,将「Ollama」拖拽到「应用程序」文件夹;
- 打开终端,执行
ollama --version触发服务启动(首次启动可能需要 10 秒左右)。
- Linux 系统:
- 安装完成后,执行
systemctl start ollama启动 Ollama 服务(设置开机自启:systemctl enable ollama)。
- 安装完成后,执行
打开终端,执行一键安装命令:
curl -fsSL https://ollama.com/install.sh | sh
2. 验证 Ollama 安装成功
打开终端 / 命令行,执行以下命令,若能显示 Ollama 版本号,则说明安装成功:
ollama --version
# ollama version is 0.14.2 (本文用的版本)
3. 下载必备开源模型
本文项目需求,需要下载两款模型:「对话生成模型」(负责回答用户问题)和「文本向量化模型」(负责将文档 / 问题转换为向量),以下对话生成模型和文本向量化模型可以根据自己需求切换:

