跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
Shell / BashAI算法

自建本地 AI 问答大模型:Ollama + Open WebUI 部署指南

综述由AI生成如何在本地环境中使用 Docker 部署 Ollama 和 Open WebUI,实现私有化大语言模型服务。内容包括 Ollama 的镜像拉取、模型运行及交互方式,Open WebUI 的容器化配置与连接,以及通过 Modelfile 自定义系统提示词以优化中文回复效果。此外还涵盖了资源占用监控及常见调试方法,帮助用户快速搭建离线 AI 助手。

晚风告白发布于 2025/2/7更新于 2026/5/3022 浏览
自建本地 AI 问答大模型:Ollama + Open WebUI 部署指南

Ollama + Open WebUI 本地部署指南

简介

Ollama 是一个开源项目,提供了部署和运行各种大型语言模型的平台和工具集。Open WebUI 则是一个基于 Web 的用户界面,允许用户通过浏览器与 Ollama 进行交互。本文将详细介绍如何结合两者在本地构建私有化的 AI 问答系统。

环境准备

确保您的机器已安装 Docker 和 Docker Compose。建议使用 Linux 或 WSL2 环境以获得最佳性能。

Ollama 部署

推荐使用 Docker 方式部署,简单且易于管理。

1. 拉取镜像
docker pull ollama/ollama:latest
2. 启动容器

根据硬件配置选择相应的启动命令:

AMD 显卡 (ROCm)

docker run -d -v /mnt/c/ubuntu-wsl/data/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama:rocm

英伟达显卡 (CUDA)

docker run -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

仅 CPU 模式

docker run -d -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

模型管理

Ollama 支持多种主流开源模型。以下是常用模型列表:

模型名称参数量大小启动命令
llama38B4.7GBollama run llama3:8b
llama370B40GBollama run llama3:70b
gemma7B5.0GBollama run gemma:7b
mistral7B4.1GBollama run mistral:7b
qwen72B41GBollama run qwen:72b
phi33.8B2.2GBollama run phi3:3.8b
llava7B4.7GBollama run llava:7b
下载与运行模型

进入容器内部运行模型,首次执行会自动下载:

docker exec -it ollama ollama run llama3

等待下载完成后,即可进入交互模式输入指令。

Open WebUI 部署

Open WebUI 提供友好的图形界面,支持多轮对话、文件上传等功能。

1. 启动容器
docker run -d -p 8186:8080 --add-host=host.docker.internal:host-gateway -v openwebui:/app/backend --name open-webui ollama/open-webui

*注意:请确保端口 8186 未被占用。

2. 访问界面

浏览器访问 http://localhost:8186/。首次访问需注册账号(通常使用邮箱)。

3. 连接 Ollama

在设置中确认 Ollama 的连接地址。如果是本地 Docker 网络,可能需要配置环境变量 OLLAMA_HOST 指向 http://host.docker.internal:11434。

优化中文回复体验

默认模型可能倾向于英文回复。可以通过创建自定义 ModelFile 来强制指定语言。

1. 创建 Modelfile

在项目目录下创建 Modelfile 文件:

from llama3
PARAMETER temperature 1
PARAMETER num_ctx 6000
PARAMETER top_k 50
PARAMETER top_p 0.95
SYSTEM """
尽你的最大可能和能力回答用户的问题。不要重复回答问题。不要说车轱辘话。语言要通顺流畅。
RULES:
- Be precise, do not reply emoji.
- Always response in Simplified Chinese, not English.
"""
2. 构建自定义模型
ollama create cusllama3 -f Modelfile
3. 应用新模型

在 Open WebUI 中选择 cusllama3 作为对话模型,即可获得更规范的中文回复。

常见问题排查

  1. 无法连接 Ollama: 检查防火墙是否开放 11434 端口,确认 OLLAMA_HOST 环境变量配置正确。
  2. 显存不足: 尝试使用量化版本较小的模型(如 7B 以下),或减少上下文长度 num_ctx。
  3. CPU 占用过高: 生成过程会占用大量 CPU/内存资源,建议关闭其他高负载程序。

总结

通过 Docker 部署 Ollama 和 Open WebUI,用户可以低成本地拥有私有化大模型能力。配合自定义 System Prompt,可显著提升特定场景下的回复质量。

目录

  1. Ollama + Open WebUI 本地部署指南
  2. 简介
  3. 环境准备
  4. Ollama 部署
  5. 1. 拉取镜像
  6. 2. 启动容器
  7. 模型管理
  8. 下载与运行模型
  9. Open WebUI 部署
  10. 1. 启动容器
  11. 2. 访问界面
  12. 3. 连接 Ollama
  13. 优化中文回复体验
  14. 1. 创建 Modelfile
  15. 2. 构建自定义模型
  16. 3. 应用新模型
  17. 常见问题排查
  18. 总结
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • 二分查找算法进阶:山脉数组与旋转排序
  • AI Agent 学习路线:从小白到大神的 20 篇精选文章
  • VR 大空间项目内容规划与设计市场经验总结(2023-2026)
  • Ubuntu 24.04 向日葵连接失败解决方法
  • 腾讯云服务器部署 OpenClaw 对接飞书实战
  • Ubuntu 系统下 CUDA 环境安装与配置
  • 基于 CLIProxyAPI 与 New API 构建统一 AI 中转站实战指南
  • VS Code 集成 Overleaf 插件实现本地 AI 辅助写作
  • LibreCAD DXF/DWG 文件读取与转换教程
  • OpenClaw Gateway 连接断开与超时问题排查
  • 2026 GitHub 热门 Python 项目:AI 代理与数据工具精选
  • Java Web 网上衣橱商城系统:JSP+Servlet+MySQL 实现
  • OpenClaw 飞书 AI 机器人搭建指南
  • 解决 JavaScript 精度丢失:BigNumber.js 核心用法与场景
  • ClawPanel 开源智能管理面板:支持 20+ 通道与多模型配置
  • LeetCode 11:盛最多水的容器
  • 主流开源无人机巡检系统项目调研
  • Transformer 原理详解与 PyTorch 编码实现
  • C++ 红黑树详解:原理、插入与验证
  • 电科金仓 KES V9 2025:融合 AI 与多模态数据库技术解析

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online