DeepSeek-OCR-WEBUI 私有化部署指南 | 极客日志

PythonAI算法

DeepSeek-OCR-WEBUI 私有化部署指南

DeepSeek-OCR-WEBUI 是基于 Gradio 的 Web 应用，支持多模式 OCR 及 GPU 加速。详述其私有化部署流程，涵盖 Ubuntu 环境准备、Docker 安装、NVIDIA 容器工具配置及容器启动。通过容器化方案实现本地 OCR 服务，支持图片、PDF 识别及 API 调用，满足企业文档处理需求。

雾岛听风发布于 2026/4/6更新于 2026/5/2026 浏览

1. 背景与需求分析

光学字符识别（OCR）技术在企业级文档处理、金融票据自动化、教育数字化等场景中扮演着关键角色。随着大模型技术的发展，传统 OCR 系统在复杂背景、手写体、低分辨率图像中的局限性日益凸显。DeepSeek-OCR 作为国产自研的高性能 OCR 引擎，融合了 CNN 与注意力机制，在中文文本识别精度上表现尤为突出。

然而，官方提供的推理代码缺乏可视化交互界面，导致调试和使用成本较高。为此，开源社区开发者基于 DeepSeek-OCR 构建了DeepSeek-OCR-WEBUI——一个功能完整、支持多模式识别的 Web 应用，极大提升了用户体验和工程落地效率。

本文将围绕该镜像的私有化部署展开，详细介绍从环境准备到服务上线的全流程实践，帮助开发者快速搭建本地化 OCR 服务。

2. 技术架构与核心优势

2.1 系统整体架构

DeepSeek-OCR-WEBUI 采用模块化设计，主要由以下组件构成：

前端层：Gradio 构建的交互式 Web 界面，支持拖拽上传、结果高亮、批量处理
推理引擎层：基于 transformers 框架加载 DeepSeek-OCR 模型，兼顾稳定性与性能
后处理模块：集成文本纠错、标点统一、断字恢复等功能，提升输出可读性
容器运行时：Docker + NVIDIA Container Toolkit 实现 GPU 加速推理

其技术栈如下：

Frontend: Gradio UI 
Inference Engine: HuggingFace Transformers 
Model: deepseek-ai/DeepSeek-OCR 
Runtime: Docker + nvidia-container-toolkit 
Hardware Support: NVIDIA GPU (CUDA >= 11.8), Apple Silicon (MPS)

2.2 核心功能亮点

功能	描述
7 种识别模式	支持文档解析、通用 OCR、图表提取、查找定位、图像描述、纯文本提取、自定义提示
边界框可视化	在'Find'模式下自动标注文字位置，便于结构化信息提取
PDF 自动转换	上传 PDF 文件后自动转为图片序列进行逐页识别

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 更新软件包索引
sudo apt-get update
# 安装必要依赖
sudo apt-get install -y apt-transport-https ca-certificates curl software-properties-common
# 添加 Docker 官方 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo apt-key add -
# 添加 Docker 稳定版仓库
sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"
# 再次更新并安装 Docker CE
sudo apt-get update
sudo apt-get install -y docker-ce
# 将当前用户加入 docker 组，避免每次使用 sudo
sudo usermod -aG docker ${USER}

sudo tee /etc/docker/daemon.json <<-'EOF'
{
  "data-root": "/data/docker",
  "exec-opts":["native.cgroupdriver=systemd"],
  "registry-mirrors": [
    "https://docker.m.daocloud.io",
    "https://mirror.ccs.tencentyun.com",
    "https://hub-mirror.c.163.com"
  ],
  "log-driver":"json-file",
  "log-opts": {"max-size":"100m", "max-file":"3"}
}
EOF
# 重启 Docker 服务
sudo systemctl daemon-reload
sudo systemctl restart docker
sudo systemctl enable docker

nvidia-smi

# 安装基础依赖
sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2
# 添加 NVIDIA 容器工具链 GPG 密钥和源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 启用 experimental 源（可选）
sudo sed -i -e '/experimental/ s/^#//g' /etc/apt/sources.list.d/nvidia-container-toolkit.list
# 更新并安装工具包
sudo apt-get update
export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1
sudo apt-get install -y \
  nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
  libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

sudo nvidia-ctk runtime configure --runtime=docker
sudo cat /etc/docker/daemon.json

{
  "runtimes": {
    "nvidia": {
      "path": "nvidia-container-runtime"
    }
  }
}

sudo systemctl restart docker

docker run --rm --gpus all nvidia/cuda:13.0.1-runtime-ubuntu22.04 nvidia-smi

git clone https://github.com/neosun100/DeepSeek-OCR-WebUI.git
cd DeepSeek-OCR-WebUI

# 在安装系统依赖后添加 pip 国内源
RUN pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple/
# 可提前安装 flash-attn whl 包以避免编译失败
COPY flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl .
RUN pip install flash_attn-2.7.3+cu11torch2.6cxx11abiFALSE-cp312-cp312-linux_x86_64.whl

docker compose up -d

docker compose ps --format "table {{.Name}}\t{{.Status}}\t{{.Ports}}"

NAME STATUS PORTS
deepseek-ocr-webui Up 2 minutes (health: starting) 6006/tcp, 8888/tcp, 0.0.0.0:8001->8001/tcp

docker logs -f deepseek-ocr-webui

# 查看日志（实时）
docker logs -f deepseek-ocr-webui
# 重启服务（适用于代码更新后）
docker restart deepseek-ocr-webui
# 完全重建服务（重新构建镜像）
docker compose down && docker compose up -d --build
# 查看资源占用情况
docker stats deepseek-ocr-webui
# 进入容器内部调试
docker exec -it deepseek-ocr-webui bash

# docker-compose.yml 片段
volumes:
  - ./models:/app/models

http://<your-server-ip>:8001/

curl -X POST "http://<ip>:8001/ocr" \ 
-H "Content-Type: multipart/form-data" \ 
-F "[email protected]" \ 
-F "mode=ocr"

{
  "text": "不被嘲笑的梦想\n是不值得去实现的",
  "boxes": [[x1,y1,x2,y2], ...],
  "success": true
}

不被嘲笑的夢想 是不值得去實現的 The dream of not being laughed at Is not worth achieving 锤子科技創始人 羅永浩 RiTOP 锐拓 昵享网 www.nipic.cn ID:33621067NO:20221012112425239106

此图片采用卡通艺术风格绘制，描绘了四位长者并排站立，背景是点缀着白云的蓝天。 ... 底部中央处写有短语'欢迎您回来，大小姐！'

DeepSeek-OCR-WEBUI 私有化部署指南

1. 背景与需求分析

2. 技术架构与核心优势

2.1 系统整体架构

2.2 核心功能亮点

更多推荐文章

相关免费在线工具

3. 部署环境准备

3.1 基础环境要求

3.2 安装 Docker 运行时

3.3 配置 Docker 镜像加速与存储路径

4. 部署 NVIDIA 容器工具包

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认使用 NVIDIA 运行时

4.4 测试 GPU 容器支持

5. 拉取并构建 DeepSeek-OCR-WEBUI 镜像

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 使用 Docker Compose 启动服务

6. 服务管理与日常运维

6.1 常用容器操作命令

6.2 模型缓存路径说明

7. 功能测试与接口调用

7.1 Web 界面访问

7.2 API 文档与健康检查

7.3 实际识别效果示例

示例 1：中文海报识别

示例 2：卡通图像描述

8. 总结

更多推荐文章

相关免费在线工具

DeepSeek-OCR-WEBUI 私有化部署指南

1. 背景与需求分析

2. 技术架构与核心优势

2.1 系统整体架构

2.2 核心功能亮点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 部署环境准备

3.1 基础环境要求

3.2 安装 Docker 运行时

3.3 配置 Docker 镜像加速与存储路径

4. 部署 NVIDIA 容器工具包

4.1 验证 GPU 驱动状态

4.2 安装 NVIDIA Container Toolkit

4.3 配置 Docker 默认使用 NVIDIA 运行时

4.4 测试 GPU 容器支持

5. 拉取并构建 DeepSeek-OCR-WEBUI 镜像

5.1 克隆项目代码

5.2 优化 Dockerfile（可选）

5.3 使用 Docker Compose 启动服务

6. 服务管理与日常运维

6.1 常用容器操作命令

6.2 模型缓存路径说明

7. 功能测试与接口调用

7.1 Web 界面访问

7.2 API 文档与健康检查

7.3 实际识别效果示例

示例 1：中文海报识别

示例 2：卡通图像描述

8. 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具