LlamaIndex 本地大模型起步教程 | 极客日志

PythonAI算法

LlamaIndex 本地大模型起步教程

本教程演示如何利用 LlamaIndex 框架配合本地运行的 Ollama 服务实现大语言模型应用开发。通过集成 BAAI/bge-small-en-v1.5 嵌入模型与 Mistral-7B 语言模型，完成文档加载、索引构建及问答查询的全流程。内容涵盖环境依赖安装、核心代码解析、索引持久化保存及常见故障排查，帮助开发者快速搭建私有化知识库系统。

LinuxPan发布于 2025/2/7更新于 2026/6/216 浏览

LlamaIndex 本地大模型起步教程

本教程演示如何利用 LlamaIndex 框架配合本地运行的 Ollama 服务实现大语言模型应用开发。通过集成 BAAI/bge-small-en-v1.5 嵌入模型与 Mistral-7B 语言模型，完成文档加载、索引构建及问答查询的全流程。

环境准备

在开始之前，请确保您的开发环境满足以下要求：

Python 版本：建议 Python 3.8 或更高版本。
Ollama 安装：
- macOS 和 Linux 用户可直接下载官方安装包。
- Windows 用户建议使用 WSL 2 环境进行安装。
- 访问 Ollama 官网获取详细安装指南。

依赖库安装：

pip install llama-index
pip install llama-index-llms-ollama
pip install llama-index-embeddings-huggingface

硬件资源：
- 运行 Mistral-7B 模型建议至少拥有 32GB 内存的机器，以确保推理流畅。

数据准备

本示例使用 Paul Graham 的文章《What I Worked On》作为测试文本。您可以从 LlamaIndex 官方仓库的 examples 文件夹中获取该文件，或者自行创建文本文件。

请在项目根目录下创建一个名为 data 的文件夹，并将文本文件（例如 paul_graham_essay.txt）放入其中。

目录结构如下：

├── starter.py
└── data
    └── paul_graham_essay.txt

构建索引

在项目根目录下创建 starter.py 文件，编写以下代码以加载数据并构建向量索引。

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader, Settings
from llama_index.core.embeddings import resolve_embed_model
from llama_index.llms.ollama import Ollama

# 1. 加载文档
# SimpleDirectoryReader 会自动读取 data 文件夹下的所有文本文件
documents = SimpleDirectoryReader("data").load_data()
print(f"已加载 {len(documents)} 个文档")

# 2. 配置嵌入模型
# 使用本地 BAAI/bge-small-en-v1.5 模型
Settings.embed_model = resolve_embed_model("local:BAAI/bge-small-en-v1.5")

# 3. 配置大语言模型
# 使用 Ollama 包装的 Mistral 模型，设置请求超时时间
Settings.llm = Ollama(model=, request_timeout=)


index = VectorStoreIndex.from_documents(documents)
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 创建查询引擎
query_engine = index.as_query_engine()

# 发起查询
response = query_engine.query("What did the author do growing up?")

# 打印结果
print(response)

# 保存索引到本地存储
index.storage_context.persist(persist_dir="./storage")

# 后续加载已保存的索引
from llama_index.core import StorageContext, load_index_from_storage

storage_context = StorageContext.from_defaults(persist_dir="./storage")
loaded_index = load_index_from_storage(storage_context)
query_engine = loaded_index.as_query_engine()

LlamaIndex 本地大模型起步教程

LlamaIndex 本地大模型起步教程

环境准备

数据准备

构建索引

更多推荐文章

相关免费在线工具

代码说明

查询数据

索引持久化

常见问题排查

总结

更多推荐文章

相关免费在线工具

LlamaIndex 本地大模型起步教程

LlamaIndex 本地大模型起步教程

环境准备

数据准备

构建索引

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

代码说明

查询数据

索引持久化

常见问题排查

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具