AI 驱动的 PDF 文档智能解析：MinerU 本地部署与 API 调用 | 极客日志

PythonAI算法

AI 驱动的 PDF 文档智能解析：MinerU 本地部署与 API 调用

综述由AI生成MinerU 是一款将复杂 PDF 文档转换为 LLM 可用 Markdown 或 JSON 格式的工具，支持 Agentic 工作流。主要功能包括文档结构解析、多媒体提取、公式识别（LaTeX）、表格识别（HTML）及 OCR 支持。 MinerU 的环境准备（CPU/GPU 要求、Python 版本）、安装方法（pip、源码、Docker）、配置文件详解及实战演示（命令行与 API 调用）。此外还涵盖了输出结果分析、性能优化策略、常见问题解决方案以及适用场景，如学术论文解析和企业知识库构建。通过 MinerU 可实现高质量的结构化文档处理。

协议工匠发布于 2026/4/6更新于 2026/5/2231 浏览

什么是 MinerU？

MinerU 是一个将复杂文档（如 PDF）转换为 LLM 就绪的 markdown/JSON 格式的工具，用于 Agentic 工作流。相比传统 PDF 解析工具，MinerU 在文档结构解析、多媒体提取、公式识别等方面有着显著优势。

主要功能包括：

文档结构解析：移除页眉页脚、脚注、页码等，确保语义连贯性
内容提取：输出按人类可读顺序排列的文本，支持单列、多列和复杂布局
格式保持：保留原始文档结构（标题、段落、列表等）
多媒体提取：提取图像、图像描述、表格、表格标题和脚注
公式识别：自动将文档中的公式转换为 LaTeX 格式
表格识别：自动将表格转换为 HTML 格式
OCR 支持：自动检测扫描版 PDF 并启用 OCR 功能，支持 84 种语言
多平台支持：兼容 Windows、Linux、Mac 平台，支持 CPU/GPU/NPU 加速

环境准备与安装

硬件要求

CPU 推理：支持纯 CPU 环境
GPU 要求：Turing 架构及以上，6GB+ 显存（pipeline 后端）或 8GB+ 显存（VLM 后端）
内存要求：最低 16GB+，推荐 32GB+
磁盘空间：20GB+，建议 SSD
Python 版本：3.10-3.13

安装方法

使用 pip 或 uv 安装

pip install --upgrade pip
pip install uv
pip install -U "mineru[core]"

从源码安装

git clone https://github.com/opendatalab/MinerU.git
cd MinerU
uv pip install -e .[core]

Docker 部署

项目提供 Docker 部署方式，可快速搭建环境解决兼容性问题。

配置文件详解

MinerU 提供了灵活的配置选项，主要包括：

解析后端设置（pipeline 和 VLM 两种）
输出格式选择（Markdown、JSON 等）
OCR 语言设置

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

mineru -p <输入路径> -o <输出路径>

mineru -p ./pdfs/三国演义.pdf -o ./output/

import requests

token = "官网申请的 api token"
url = "https://mineru.net/api/v4/extract/task"
header = {
    "Content-Type": "application/json",
    "Authorization": f"Bearer {token}"
}
data = {
    "url": "https://cdn-mineru.openxlab.org.cn/demo/example.pdf",
    "is_ocr": True,
    "enable_formula": False
}
res = requests.post(url, headers=header, json=data)
print(res.status_code)
print(res.json())
print(res.json()["data"])

AI 驱动的 PDF 文档智能解析：MinerU 本地部署与 API 调用

什么是 MinerU？

环境准备与安装

硬件要求

安装方法

使用 pip 或 uv 安装

从源码安装

Docker 部署

配置文件详解

更多推荐文章

相关免费在线工具

实战演示

命令行使用

API 调用方式

输出结果分析

特殊内容处理

性能优化与调优

提升解析速度的方法

内存和显存优化

常见问题与解决方案

安装过程中的常见错误

解析质量相关问题

优势与应用场景

技术亮点

适用场景

总结

更多推荐文章

相关免费在线工具

AI 驱动的 PDF 文档智能解析：MinerU 本地部署与 API 调用

什么是 MinerU？

环境准备与安装

硬件要求

安装方法

使用 pip 或 uv 安装

从源码安装

Docker 部署

配置文件详解

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

实战演示

命令行使用

API 调用方式

输出结果分析

特殊内容处理

性能优化与调优

提升解析速度的方法

内存和显存优化

常见问题与解决方案

安装过程中的常见错误

解析质量相关问题

优势与应用场景

技术亮点

适用场景

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具