使用Docker安装Ollama及Open-WebUI完整教程

优质文章学习记录

09 Apr 2026 — 5 min read

作者：吴业亮
博客：wuyeliang.blog.ZEEKLOG.net

一、Ollama 简介及工作原理

1. Ollama 简介及原理

简介：Ollama 是一款轻量级、开源的大语言模型（LLM）运行工具，旨在简化本地部署和运行大语言模型的流程。它支持 Llama 3、Mistral、Gemini 等主流开源模型，用户无需复杂配置即可在本地设备（CPU 或 GPU）上快速启动模型，适用于开发测试、本地智能应用搭建等场景。
工作原理：
- 采用模型封装机制，将大语言模型的运行环境、依赖库及推理逻辑打包为标准化格式，实现模型的一键下载、启动和版本管理。
- 通过优化的推理引擎适配硬件架构，支持 CPU 基础运行和 GPU 加速（如 NVIDIA CUDA），减少资源占用并提升响应速度。
- 提供简洁的 REST API 和命令行接口，降低开发者集成门槛，无需深入了解模型底层细节即可调用。
- 支持容器化部署，确保跨环境一致性，避免依赖冲突问题。

2. Open-WebUI 简介及原理

简介：Open-WebUI 是一款开源的可视化界面工具，专为 Ollama 设计，提供直观的交互界面用于管理和使用大语言模型。它支持模型切换、对话历史记录、参数调整等功能，让本地大语言模型的使用更便捷。
工作原理：
- 作为前端交互层，通过 API 与 Ollama 后端通信，接收用户输入并将其转发给 Ollama 进行模型推理。
- 解析 Ollama 返回的结果并以自然语言对话形式展示给用户，同时记录对话历史并支持上下文关联。
- 提供模型管理功能，可直接在界面中下载、启动、停止 Ollama 支持的模型，简化模型运维流程。
- 支持容器化部署，与 Ollama 容器通过网络互通，实现快速搭建完整的本地大语言模型交互系统。

二、安装Docker

1. 安装Docker依赖

apt-getinstall ca-certificates curl gnupg lsb-release

2. 添加阿里云Docker软件源

curl -fsSL http://mirrors.aliyun.com/docker-ce/linux/ubuntu/gpg |sudo apt-key add -

3. 配置系统软件源

编辑/etc/apt/sources.list文件，添加以下内容（清华大学Ubuntu镜像源）：

# 默认注释了源码镜像以提高 apt update 速度，如有需要可自行取消注释 deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-updates main restricted universe multiverse deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-backports main restricted universe multiverse # 安全更新软件源 deb http://security.ubuntu.com/ubuntu/ focal-security main restricted universe multiverse # deb-src http://security.ubuntu.com/ubuntu/ focal-security main restricted universe multiverse # 预发布软件源，不建议启用 # deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse # # deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ focal-proposed main restricted universe multiverse

4. 添加Docker软件源并更新密钥

add-apt-repository "deb [arch=amd64] http://mirrors.aliyun.com/docker-ce/linux/ubuntu $(lsb_release -cs) stable"sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys DDCAE044F796ECB0

5. 安装Docker

apt-getinstall docker-ce docker-ce-cli containerd.io

6. 验证Docker安装

docker -v

7. 配置Docker国内镜像源

7.1 编辑配置文件`/etc/docker/daemon.json`

{"registry-mirrors":["https://docker.mirrors.ustc.edu.cn","https://hub-mirror.c.163.com","https://docker.m.daocloud.io","https://ghcr.io","https://mirror.baidubce.com","https://docker.nju.edu.cn"]}

7.2 重新加载并重启Docker

systemctl daemon-reload systemctl restart docker

三、安装英伟达显卡驱动（GPU支持）

1. 配置存储库

curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey |sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg

2. 设置源

创建并编辑nvidia-container-toolkit.list文件：

# 内容如下 deb https://mirrors.ustc.edu.cn/libnvidia-container/stable/deb/$(ARCH) / deb https://mirrors.ustc.edu.cn/libnvidia-container/stable/ubuntu18.04/$(ARCH) / #deb https://mirrors.ustc.edu.cn/libnvidia-container/experimental/deb/$(ARCH) /#deb https://mirrors.ustc.edu.cn/libnvidia-container/experimental/ubuntu18.04/$(ARCH) /

3. 更新包列表

sudoapt-get update

4. 安装NVIDIA Container Toolkit

apt-getinstall -y nvidia-container-toolkit

5. 配置Docker以支持Nvidia驱动

nvidia-ctk runtime configure --runtime=docker

6. 重启Docker服务

systemctl restart docker.service

四、使用Docker安装Ollama

1. 拉取Ollama镜像

官方镜像：

docker pull ollama/ollama:latest

国内镜像（推荐）：

docker pull dhub.kubesre.xyz/ollama/ollama:latest

2. 启动Ollama容器

docker run -d \ --gpus=all \ --restart=always \ -v /root/project/docker/ollama:/root/project/.ollama \ -p 11434:11434 \ --name ollama \ ollama/ollama

说明：此配置会让Ollama将模型保持加载在内存（显存）中

五、使用Docker安装Open-WebUI

1. 安装Main版本

docker run -d \ -p 15027:8080 \ --gpus all \ --add-host=host.docker.internal:host-gateway \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.nju.edu.cn/open-webui/open-webui:main

2. 安装CUDA版本（GPU加速）

docker run -d \ -p 15027:8080 \ --gpus all \ --add-host=host.docker.internal:host-gateway \ -v open-webui:/app/backend/data \ --name open-webui \ --restart always \ ghcr.nju.edu.cn/open-webui/open-webui:cuda

3. 访问Open-WebUI

打开浏览器访问以下地址进行登录：

http://192.168.1.129:15027/auth

全员DeepSeek时代，前端能做些什么？

全员DeepSeek时代，前端能做些什么？ 2025–2026 年，随着 DeepSeek V3 / R1 系列（尤其是代码生成、前端页面生成能力）的爆发式提升，“全员DeepSeek”已经从梗变成了很多团队的真实工作流。 AI 正在快速吃掉“机械重复的前端编码”，但这并不意味着前端要凉，反而是一次非常大的角色升级机会。下面从现实、趋势和可执行路径三个层面给你讲清楚：前端在 DeepSeek 时代到底能/该干什么。 1. 先认清现实：DeepSeek 已经抢走了哪些活？根据大量实测和社区反馈（2025 年下半年尤为明显），DeepSeek 系列在以下场景已经非常实用： * 常规 CRUD 后台管理系统页面（表单、表格、抽屉、树形结构） * 中后台常见的组件组合（搜索 + 列表 + 分页 + 操作栏） * Tailwind + React / Vue

6个开源视觉模型推荐：M2FP支持WebUI交互，调试更高效

6个开源视觉模型推荐：M2FP支持WebUI交互，调试更高效在计算机视觉领域，人体解析（Human Parsing）作为语义分割的精细化分支，正广泛应用于虚拟试衣、动作识别、智能安防和人机交互等场景。传统方案多聚焦单人解析，面对多人重叠、遮挡或复杂背景时表现不稳定。本文将重点介绍基于 ModelScope 的 M2FP 多人人体解析服务，并延伸推荐5个功能互补的开源视觉模型，构建从开发到部署的完整技术生态。 🧩 M2FP 多人人体解析服务 (WebUI + API) 📖 项目简介本镜像基于 ModelScope 平台的 M2FP (Mask2Former-Parsing) 模型构建，专为多人人体解析任务优化。M2FP 融合了 Mask2Former 的 Transformer 解码架构与人体解析领域的先验知识，在 LIP 和 CIHP 等权威数据集上达到 SOTA（State-of-the-Art）性能。该模型能够对图像中多个个体进行像素级语义分割，精确区分多达 18

OpenClaw（Clawdbot）运行原理剖析：你的个人AI操作系统的引擎是如何工作的？

OpenClaw（Clawdbot）运行原理剖析：你的个人AI操作系统的引擎是如何工作的？如果你曾想象过拥有一个能直接操控你电脑、完成实际任务的AI助手，那么理解OpenClaw（原名Clawdbot）的运行原理，就像是在窥探未来个人计算的引擎舱。最近我深度体验并部署了OpenClaw，这个开源项目将大语言模型的“思考”能力与本地系统的“执行”能力结合，实现了一种全新的交互范式。在这篇博客中，我将结合自己的实践，为你深入剖析OpenClaw是如何在后台协同工作的。一、核心架构：客户端-服务器模型 OpenClaw最核心的设计采用了经典的客户端-服务器（Client-Server）模型。理解这一点，是理解整个系统的基础。当你安装OpenClaw后，实际上得到了两个主要部分： * 网关服务（Gateway）：作为常驻后台的“服务器”或“引擎” * 用户界面（TUI/Web/聊天软件）：作为与用户交互的“客户端” 它们之间的关系，可以用下面的架构图清晰地表示：发送指令/接收回复调度与执行执行层 (技能与连接) 技能库

openJiuwen集成蓝耘AI模型深度解析：从架构设计到企业级Agent实战部署

前言在人工智能技术从单纯的感知智能向认知智能演进的浪潮中，大语言模型（LLM）的成熟催生了AI Agent（人工智能体）这一全新的应用形态。AI Agent不再局限于传统的单指令执行，而是演进为具备自主感知、推理规划、决策执行能力的智能实体。在这一技术变革背景下，openJiuwen作为一个致力于提供灵活、强大且易用能力的开源Agent平台应运而生。本文将深度剖析openJiuwen的技术架构、核心优势，并基于真实的服务器部署环境，详细拆解从底层环境搭建到上层复杂智能体构建的全过程。一、 Agentic AI时代的基础设施：openJiuwen概览 openJiuwen的定位不仅是一个开发工具，而是面向生产级应用的Agent全生命周期管理平台。它旨在解决当前大模型应用落地过程中面临的开发门槛高、协同调度难、运行稳定性差等痛点。通过提供标准化的开发框架与高可靠的运行引擎，openJiuwen支持开发者快速构建能够处理各类简单或复杂任务的AI Agent，并实现多Agent间的协同交互。作为核心代码资产的入口，开发者能在这里查看项目的 Readme 文档、分支管理和最新提交