PaddleOCR 实战：Python 快速实现图片文字识别与部署 | 极客日志

PythonAI算法

PaddleOCR 实战：Python 快速实现图片文字识别与部署

PaddleOCR 实战指南涵盖环境搭建、Python 调用及部署方案。重点介绍 PP-OCRv4 模型选择、参数调优、结果可视化及常见问题处理，帮助开发者快速集成文字识别功能。

古灵精怪发布于 2026/3/16更新于 2026/6/818 浏览

在 OCR（光学字符识别）领域，国产开源项目 PaddleOCR 凭借其超轻量级、高精度和多语言支持，已成为事实上的工业级标杆。无论你是 AI 初学者还是寻找落地方案的工程师，这篇文章都能帮你快速上手 PP-OCRv4 模型。

PaddleOCR 简介：为什么选择它？

PaddleOCR 是基于百度飞桨（PaddlePaddle）开发的 OCR 工具库。它的核心优势在于：

PP-OCR 系列模型：提供超轻量模型（适合移动端/嵌入式）和通用模型（适合服务器），在速度和精度之间取得了极佳平衡。目前最新的 PP-OCRv4 效果显著。
功能丰富：支持文本检测、文本识别、关键信息提取（KIE）、表格识别等。
多语言：支持中、英、法、德、韩、日等 80 多种语言。

环境搭建 (Environment Setup)

在开始之前，请确保你的环境安装了 Python 3.8+。

安装 PaddlePaddle

根据你的机器是否有 NVIDIA 显卡选择安装版本。

CPU 版本（通用，适合快速测试）：

python -m pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

GPU 版本（推荐，速度更快，需安装 CUDA）：

# 具体的 CUDA 版本号请参考官网 python -m pip install paddlepaddle-gpu -i https://mirror.baidu.com/pypi/simple

安装 PaddleOCR 及其依赖

一行命令安装核心库：

pip install "paddleocr>=2.0.1"

同时，为了后续可视化，建议安装 OpenCV 和 Matplotlib：

pip install opencv-python matplotlib

Python 核心实战：文字识别

接下来，我们编写一个 Python 脚本，使用 PP-OCRv4 模型识别一张包含中文的图片。

准备一张测试图片

假设你有一张名为 test_img.jpg 的图片（可以是发票、路牌或文档截图）。

编写代码

新建文件 ocr_demo.py：

from paddleocr import PaddleOCR, draw_ocr
import cv2
import matplotlib.pyplot as plt

# 1. 初始化 OCR 模型
# use_angle_cls=True: 自动加载方向分类器，用于纠正翻转的文字
# lang="ch": 设置语言为中文
print("正在加载模型...")
ocr = PaddleOCR(use_angle_cls=True, lang="ch")


img_path = 



()
result = ocr.ocr(img_path, cls=)


()
 idx  ((result)):
    res = result[idx]
     line  res:
        ()
()


 PIL  Image
image = Image.(img_path).convert()
boxes = [line[]  line  result[]]
txts = [line[][]  line  result[]]
scores = [line[][]  line  result[]]


im_show = draw_ocr(image, boxes, txts, scores, font_path=)

im_show = Image.fromarray(im_show)
im_show.save()
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

# 使用 PP-OCRv4 server 模型
ocr = PaddleOCR(use_angle_cls=True, lang="ch", ocr_version='PP-OCRv4')

# 降低阈值可以检出更多模糊目标，但可能增加误检
result = ocr.ocr(img_path, cls=True, det_db_thresh=0.3)

参数	默认值	说明
`det_db_thresh`	0.3	二值化阈值，越低召回率越高
`det_db_box_thresh`	0.6	检测框阈值，低于该值的框会被过滤
`use_gpu`	True	是否使用 GPU 加速

pip install paddlehub

# 启动中文 OCR 服务模块 hub serving start -m ch_pp-ocrv3 -p 8866

import requests
import json
import cv2
import base64

def cv2_to_base64(image):
    data = cv2.imencode('.jpg', image)[1]
    return base64.b64encode(data.tostring()).decode('utf8')

# 发送请求
headers = {"Content-type": "application/json"}
url = "http://127.0.0.1:8866/predict/ch_pp-ocrv3"
img = cv2_to_base64(cv2.imread('test_img.jpg'))
data = {'images': [img], 'text': 'true'}
r = requests.post(url=url, headers=headers, data=json.dumps(data))
print(r.json())

Q: 报错 OMP: Error #15: Initializing libiomp5md.dll, but found libiomp5md.dll already initialized.
- A: 在代码最开头加入以下环境变量设置：
```
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"
```
Q: 识别出的中文是乱码？
- A: 请检查终端编码，或者在可视化时确认 font_path 指向了正确的中文字体文件。
Q: 第一次运行很慢？
- A: 第一次运行 PaddleOCR() 时会自动下载模型权重文件（约 15MB），后续运行会直接加载本地缓存。

PaddleOCR 实战：Python 快速实现图片文字识别与部署

PaddleOCR 简介：为什么选择它？

环境搭建 (Environment Setup)

安装 PaddlePaddle

安装 PaddleOCR 及其依赖

Python 核心实战：文字识别

准备一张测试图片

编写代码

更多推荐文章

相关免费在线工具

运行效果

进阶实战：参数调优与模型选择

切换服务器模型（高精度）

调整检测阈值

极速部署：PaddleHub Serving

安装 PaddleHub

启动服务

发送请求

常见问题 (FAQ)

总结

更多推荐文章

相关免费在线工具

PaddleOCR 实战：Python 快速实现图片文字识别与部署

PaddleOCR 简介：为什么选择它？

环境搭建 (Environment Setup)

安装 PaddlePaddle

安装 PaddleOCR 及其依赖

Python 核心实战：文字识别

准备一张测试图片

编写代码

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

运行效果

进阶实战：参数调优与模型选择

切换服务器模型（高精度）

调整检测阈值

极速部署：PaddleHub Serving

安装 PaddleHub

启动服务

发送请求

常见问题 (FAQ)

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具