DeepSeek-OCR-WebUI 部署指南：支持 7 种识别模式与 GPU 加速 | 极客日志

PythonAI算法

DeepSeek-OCR-WebUI 部署指南：支持 7 种识别模式与 GPU 加速

DeepSeek-OCR-WebUI 提供基于 DeepSeek-OCR 模型的 Web 界面，支持文档转 Markdown、通用 OCR、图表解析等七种识别模式。介绍在 Ubuntu 环境下通过 Docker 部署该项目的完整流程，包括 NVIDIA 驱动配置、Container Toolkit 安装及容器启动验证。项目支持 GPU 加速，具备 PDF 处理、批量识别及可视化定位功能，适用于本地化大模型图像理解场景。

GitMaster发布于 2026/4/9更新于 2026/5/2513 浏览

DeepSeek-OCR-WebUI 部署指南

DeepSeek-OCR-WebUI 是一个基于 DeepSeek-OCR 模型的图像识别 Web 应用，为官方推理代码提供了直观的用户界面和交互功能。它支持多种识别模式，并具备现代化的 UI 设计。

DeepSeek-OCR-WebUI 界面

项目仓库：https://github.com/neosun100/DeepSeek-OCR-WebUI

1. 核心特性

1.1 七大识别模式

模式	说明	适用场景
文档转 Markdown	保留格式和布局	合同、论文、报告
通用 OCR	提取所有可见文字	图片文字提取
纯文本提取	纯文本不保留格式	简单文本识别
图表解析	识别图表和公式	数据图表、数学公式
图像描述	生成详细描述	图片理解、无障碍
查找定位	查找并标注位置	发票字段定位
自定义提示	自定义识别需求	灵活的识别任务

1.2 其他亮点

边界框可视化：Find 模式下自动标注目标位置。
批量处理：支持多张图片逐一识别。
PDF 支持：上传 PDF 文件后自动转换为图片处理。
多语言支持：简体中文、繁体中文、英语、日语。
硬件加速：支持 Apple Silicon (MPS) 及 NVIDIA GPU 加速。
模型切换：HuggingFace 不可用时自动切换至 ModelScope。

1.3 技术架构

引擎: transformers（注重稳定性与兼容性）
模型: deepseek-ai/DeepSeek-OCR
GPU: NVIDIA L40S (自动检测)
推理模式: bfloat16

关于 transformers 与 vLLM 的选择，作者倾向于前者用于生产环境：

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 更新软件包索引
sudo apt-get update

# 安装必要的软件包
sudo apt-get install apt-transport-https ca-certificates curl software-properties-common

# 添加 Docker 的官方 GPG 密钥
curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /usr/share/keyrings/docker-archive-keyring.gpg

# 添加 Docker 的稳定仓库
sudo add-apt-repository "deb [arch=amd64 signed-by=/usr/share/keyrings/docker-archive-keyring.gpg] https://download.docker.com/linux/ubuntu $(lsb_release -cs) stable"

# 再次更新并安装 Docker CE
sudo apt-get update
sudo apt-get install docker-ce docker-ce-cli containerd.io

# 验证安装
sudo systemctl status docker

sudo usermod -aG docker ${USER}

cd ~
git clone https://github.com/neosun100/DeepSeek-OCR-WebUI.git
cd DeepSeek-OCR-WebUI

RUN apt-get update && apt-get install -y \
    libgl1 \
    libglib2.0-0 \
    pkg-config \
    python3-dev \
    build-essential \
    && rm -rf /var/lib/apt/lists/*

# 添加 pip 国内镜像加速
RUN pip config set global.index-url https://mirrors.huaweicloud.com/repository/pypi/simple/

nvidia-smi

# 安装依赖工具
sudo apt-get update && sudo apt-get install -y --no-install-recommends curl gnupg2

# 添加 NVIDIA Container Toolkit 的 GPG 密钥和软件源
curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg \
&& curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list

# 更新并安装
sudo apt-get update
export NVIDIA_CONTAINER_TOOLKIT_VERSION=1.18.0-1
sudo apt-get install -y \
    nvidia-container-toolkit=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
    nvidia-container-toolkit-base=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
    libnvidia-container-tools=${NVIDIA_CONTAINER_TOOLKIT_VERSION} \
    libnvidia-container1=${NVIDIA_CONTAINER_TOOLKIT_VERSION}

sudo nvidia-ctk runtime configure --runtime=docker
sudo cat /etc/docker/daemon.json

sudo systemctl restart docker

docker run --rm --gpus all nvidia/cuda:13.0.1-runtime-ubuntu22.04 nvidia-smi

cd ~/DeepSeek-OCR-WebUI
docker compose up -d

docker compose ps --format "table {{.Name}}\t{{.Status}}\t{{.Ports}}"

docker logs -f deepseek-ocr-webui

watch -n 1 nvidia-smi

# 重启服务
docker restart deepseek-ocr-webui

# 完全重启（重新加载模型）
docker compose restart

# 停止服务
docker compose down

# 重新构建并启动
docker compose up -d --build

# 查看资源使用
docker stats deepseek-ocr-webui

============================================================
图片 1: fCOdj4aJI.png
============================================================
慢慢来，你又不差...

稳定性	⭐⭐⭐⭐⭐	⭐⭐⭐
兼容性	⭐⭐⭐⭐⭐	⭐⭐⭐
速度	⭐⭐⭐⭐	⭐⭐⭐⭐⭐
部署难度	⭐⭐⭐⭐⭐	⭐⭐

DeepSeek-OCR-WebUI 部署指南：支持 7 种识别模式与 GPU 加速

DeepSeek-OCR-WebUI 部署指南

1. 核心特性

1.1 七大识别模式

1.2 其他亮点

1.3 技术架构

更多推荐文章

相关免费在线工具

2. 环境准备

2.1 安装 Docker

2.2 下载代码

2.3 环境检查

2.4 VS Code 连接与配置

3. 安装 NVIDIA Container Toolkit

3.1 确认驱动

3.2 安装 Toolkit

3.3 配置 Docker

3.4 测试 GPU 可用性

4. 启动服务

4.1 GPU 监控

4.2 容器管理

5. 访问与测试

5.1 通用 OCR 测试

5.2 图像描述测试

5.3 定位查找

更多推荐文章

相关免费在线工具

DeepSeek-OCR-WebUI 部署指南：支持 7 种识别模式与 GPU 加速

DeepSeek-OCR-WebUI 部署指南

1. 核心特性

1.1 七大识别模式

1.2 其他亮点

1.3 技术架构

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 环境准备

2.1 安装 Docker

2.2 下载代码

2.3 环境检查

2.4 VS Code 连接与配置

3. 安装 NVIDIA Container Toolkit

3.1 确认驱动

3.2 安装 Toolkit

3.3 配置 Docker

3.4 测试 GPU 可用性

4. 启动服务

4.1 GPU 监控

4.2 容器管理

5. 访问与测试

5.1 通用 OCR 测试

5.2 图像描述测试

5.3 定位查找

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具