MinerU是一款将复杂PDF文档转换为Markdown和JSON格式的工具,在公式、表格识别方面表现出色。本地部署可通过pip安装,命令行或API调用都很方便。输出结果保留了文档结构和多媒体内容,适合构建知识库和大模型预处理。
bash\npip install --upgrade pip\npip install uv\npip install -U \"mineru[core]\"\n\n\n如果你想从源码装,可以 clone 仓库然后 uv pip install -e .[core]。不过除非你要改代码,否则 pip 一条搞定。\n\npip install uv 之后最好确认一下 uv 的路径,我遇到过因为环境变量没刷新导致后续装包失败的。实在不行就老老实实 ,不用 uv 也行。另外,如果遇到依赖冲突,还是建议新建一个虚拟环境,省心。\n\nGPU 加速方面,官方说需要 Turing 架构以上、6G 显存起步,我的 2060 6G 刚好够用,但要跑 VLM 后端得 8G,所以我就用了默认的 pipeline 后端。CPU 也能跑,就是慢一些。\n\n### 命令行直接上\n\n装好之后,一个命令就可以开搞:\n\n\n\n它会自动检测文档是原生转文字的 PDF 还是扫描版,扫描版就走 OCR。结果会生成一个文件夹,里面有 Markdown 文件、图片、表格的 HTML 等。我试了一下《三国演义》的扫描本(网上随便找的),排版还原度挺高,目录、回目都分了出来,就是图片里的印章没自动裁掉,稍微有点碍眼,不过不影响正文。\n\n### API 调用:远程解析更方便\n\n自己机器不行的时候,可以用 MinerU 的云 API。去官网申请一个 token,几行代码就能调用:\n\n\n\n\n\n返回结果里有个 task_id,可以拿去轮询状态,等解析完成后下载结果。我试过一次,十来页的论文大概 20 秒出结果,速度还能接受。 如果是 False,公式就按图片保留了,如果 True 会转成 LaTeX。我通常开 True,因为后面要喂给模型的话,LaTeX 格式更友好。\n\n参数里 必须是公网可访问的 PDF 地址,不支持本地文件直接上传,这个有点麻烦——你得先把 PDF 传到 OSS 或者用他家的 demo 链接测试。\n\n### 输出结果能拿来干什么\n\n输出默认是 Markdown,也有 JSON 格式可选。Markdown 里公式是 ,表格是 HTML 标签混在 Markdown 里,图片会单独保存到一个文件夹,原文里用相对路径引用。对于需要进一步处理的场景(比如知识库切片),JSON 格式更结构化,但 Markdown 肉眼读着更舒服。\n\n我用它解析了若干技术手册,构建了一个简单的问答数据集。公式识别准确率很高,至少在我这批材料里没遇到明显错误。唯一不爽的是脚注的处理:有时候脚注跑到段尾变成一条普通句子,得手动调整。\n\n### 总结\n\nMinerU 的核心强项在于 PDF 转 Markdown 的质量,尤其是对公式和表格的还原,比同类开源工具强。如果你经常需要把文献、报告或教材转成可编辑文本,这个工具能省不少事。安装和命令行使用都比较简单,API 适合集成到自己的流程里。不过扫描版 PDF 的效果很大程度上依赖 OCR 语言模型,英文准确率高,中文偶尔会掉链子,需要自己校对一遍。\n\n整体来说,值得在工具箱里备一个。pip installbash\nmineru -p ./pdfs/三国演义.pdf -o ./output/\npython\nimport requests\n\ntoken = \"你的api token\"\nurl = \"https://mineru.net/api/v4/extract/task\"\nheader = {\n \"Content-Type\": \"application/json\",\n \"Authorization\": f\"Bearer {token}\"\n}\ndata = {\n \"url\": \"要解析的PDF在线链接\",\n \"is_ocr\": True,\n \"enable_formula\": False\n}\nres = requests.post(url, headers=header, json=data)\nprint(res.status_code)\nprint(res.json())\nenable_formulaurl$$...$$
微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online