基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

在本地环境中部署 Ollama 服务、下载 Llama3.1 模型以及通过 Open WebUI 构建图形化界面的完整流程。内容涵盖软件安装、依赖配置、模型拉取及界面访问，解决了 Windows 家庭版无法使用 Docker 时的替代方案，帮助用户快速实现私有化大模型运行。

奇形怪状发布于 2025/2/6更新于 2026/7/1737 浏览

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

前言

在本地部署大语言模型（LLM）是保护数据隐私、降低 API 调用成本以及离线使用 AI 能力的有效方案。本文将详细介绍如何使用 Ollama 作为后端推理引擎，结合 Llama3.1 模型，并通过 Open WebUI 提供友好的图形化界面，实现完整的本地大模型环境搭建。

1. 环境准备

在开始之前，请确保您的计算机满足以下基本要求：

操作系统：Windows 10/11, macOS (Intel/Apple Silicon), 或 Linux。
内存 (RAM)：建议至少 8GB，运行 Llama3.1 8B 版本推荐 16GB 以上。
磁盘空间：预留至少 20GB 用于存储模型文件。
Python 版本：Open WebUI 推荐使用 Python 3.11.0 至 3.12.0 之间版本。

2. 安装 Ollama

Ollama 是一个用于运行和部署开源大模型的轻量级工具。

2.1 Windows 用户

访问 Ollama 官网下载 Windows 安装包。
运行安装程序，选择默认路径进行安装。
安装完成后，打开命令行工具（CMD 或 PowerShell），输入 ollama 验证是否安装成功。
如果显示帮助信息，说明服务已就绪。

2.2 Mac/Linux 用户

可使用终端执行官方提供的安装脚本：

curl -fsSL https://ollama.com/install.sh | sh

3. 拉取 Llama3.1 模型

Ollama 支持通过命令行直接拉取模型。Llama3.1 是目前性能优秀的开源模型之一。

3.1 下载模型

在终端中执行以下命令拉取 Llama3.1 模型（以 8B 量化版本为例）：

ollama pull llama3.1:8b

3.2 验证模型

下载完成后，可以通过以下命令测试模型对话：

ollama run llama3.1:8b

此时进入交互模式，输入问题即可得到回复。按 Ctrl+D 退出对话。

4. 部署 Open WebUI

Open WebUI 是一个功能丰富的 Web 界面，支持多模态、插件扩展等功能。虽然 Docker 是推荐方式，但针对无法使用 Docker 的环境（如 Windows 家庭版），可以使用 pip 直接安装。

4.1 创建虚拟环境（推荐）

为避免依赖冲突，建议使用 Python 虚拟环境：

python -m venv ollama_env
# Windows 激活
ollama_env\Scripts\activate
# Linux/Mac 激活
source ollama_env/bin/activate

4.2 安装依赖

确保 pip 源为国内镜像以提升速度：

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

安装 Open WebUI：

pip install open-webui

4.3 启动服务

运行以下命令启动服务：

open-webui serve

启动成功后，控制台会显示服务地址，通常为 http://localhost:8080/。

5. 连接与使用

打开浏览器访问 http://localhost:8080/。
首次访问时，系统会提示设置管理员账号。输入的密码将作为超级管理员凭证。
登录后，进入设置页面，确保 Ollama 的 API 地址配置正确（默认为 http://host.docker.internal:11434，本地直连通常自动识别为 http://localhost:11434）。
在模型管理页面，您可以看到已下载的 Llama3.1 模型，并选择其进行对话。

6. 常见问题与优化

6.1 模型加载慢

如果模型加载缓慢，可能是由于 CPU 推理导致。若显卡支持 CUDA，可尝试在 Ollama 环境变量中指定 GPU 加速：

export OLLAMA_NUM_GPU=999

6.2 端口占用

如果 8080 端口被占用，可通过环境变量指定其他端口：

OPEN_WEBUI_PORT=8081 open-webui serve

6.3 网络代理

部分环境下可能需要配置 HTTP 代理以拉取模型或更新依赖，请在 pip 和 ollama 命令前添加代理参数。

结语

通过以上步骤，您已成功在本地构建了基于 Ollama、Llama3.1 和 Open WebUI 的大模型环境。该方案无需联网即可运行，适合开发测试及隐私敏感场景。后续可根据需求探索更多开源模型或自定义插件功能。

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

前言

1. 环境准备

在开始之前，请确保您的计算机满足以下基本要求：

操作系统：Windows 10/11, macOS (Intel/Apple Silicon), 或 Linux。
内存 (RAM)：建议至少 8GB，运行 Llama3.1 8B 版本推荐 16GB 以上。
磁盘空间：预留至少 20GB 用于存储模型文件。
Python 版本：Open WebUI 推荐使用 Python 3.11.0 至 3.12.0 之间版本。

2. 安装 Ollama

Ollama 是一个用于运行和部署开源大模型的轻量级工具。

2.1 Windows 用户

访问 Ollama 官网下载 Windows 安装包。
运行安装程序，选择默认路径进行安装。
安装完成后，打开命令行工具（CMD 或 PowerShell），输入 ollama 验证是否安装成功。
如果显示帮助信息，说明服务已就绪。

2.2 Mac/Linux 用户

可使用终端执行官方提供的安装脚本：

curl -fsSL https://ollama.com/install.sh | sh

3. 拉取 Llama3.1 模型

Ollama 支持通过命令行直接拉取模型。Llama3.1 是目前性能优秀的开源模型之一。

3.1 下载模型

在终端中执行以下命令拉取 Llama3.1 模型（以 8B 量化版本为例）：

ollama pull llama3.1:8b

3.2 验证模型

下载完成后，可以通过以下命令测试模型对话：

ollama run llama3.1:8b

此时进入交互模式，输入问题即可得到回复。按 Ctrl+D 退出对话。

4. 部署 Open WebUI

4.1 创建虚拟环境（推荐）

为避免依赖冲突，建议使用 Python 虚拟环境：

python -m venv ollama_env
# Windows 激活
ollama_env\Scripts\activate
# Linux/Mac 激活
source ollama_env/bin/activate

4.2 安装依赖

确保 pip 源为国内镜像以提升速度：

pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

安装 Open WebUI：

pip install open-webui

4.3 启动服务

运行以下命令启动服务：

open-webui serve

启动成功后，控制台会显示服务地址，通常为 http://localhost:8080/。

5. 连接与使用

打开浏览器访问 http://localhost:8080/。
首次访问时，系统会提示设置管理员账号。输入的密码将作为超级管理员凭证。
登录后，进入设置页面，确保 Ollama 的 API 地址配置正确（默认为 http://host.docker.internal:11434，本地直连通常自动识别为 http://localhost:11434）。
在模型管理页面，您可以看到已下载的 Llama3.1 模型，并选择其进行对话。

6. 常见问题与优化

6.1 模型加载慢

如果模型加载缓慢，可能是由于 CPU 推理导致。若显卡支持 CUDA，可尝试在 Ollama 环境变量中指定 GPU 加速：

export OLLAMA_NUM_GPU=999

6.2 端口占用

如果 8080 端口被占用，可通过环境变量指定其他端口：

OPEN_WEBUI_PORT=8081 open-webui serve

6.3 网络代理

部分环境下可能需要配置 HTTP 代理以拉取模型或更新依赖，请在 pip 和 ollama 命令前添加代理参数。

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

前言

1. 环境准备

2. 安装 Ollama

2.1 Windows 用户

2.2 Mac/Linux 用户

3. 拉取 Llama3.1 模型

3.1 下载模型

3.2 验证模型

4. 部署 Open WebUI

4.1 创建虚拟环境（推荐）

4.2 安装依赖

4.3 启动服务

5. 连接与使用

6. 常见问题与优化

6.1 模型加载慢

6.2 端口占用

6.3 网络代理

结语

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

基于 Ollama、Llama3.1 与 Open WebUI 搭建本地大模型环境

前言

1. 环境准备

2. 安装 Ollama

2.1 Windows 用户

2.2 Mac/Linux 用户

3. 拉取 Llama3.1 模型

3.1 下载模型

3.2 验证模型

4. 部署 Open WebUI

4.1 创建虚拟环境（推荐）

4.2 安装依赖

4.3 启动服务

5. 连接与使用

6. 常见问题与优化

6.1 模型加载慢

6.2 端口占用

6.3 网络代理

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具