低代码集成:将 PDF-Extract-Kit-1.0 接入 Power Platform
在处理企业文档时,大量 PDF 格式的合同、发票、报告需要处理。手动复制粘贴费时费力且易出错,而开发完整的自动化系统又过于复杂。本文介绍一种无需编写后端代码的方法,将 AI 驱动的 PDF 解析能力集成到 Power Apps 应用中。
PDF-Extract-Kit-1.0 是开源社区中表现出色的 PDF 内容提取工具之一。它能精准识别文本、表格、图像和公式,理解文档布局结构,即便是扫描件或模糊文件也能保持高准确率。模型支持一键部署为 HTTP 服务,便于通过 Power Automate 调用。
本文将带你实现:
- 快速部署 PDF-Extract-Kit-1.0 镜像并启动 API 服务
- 在 Power Automate 中封装该服务为自定义操作
- 在 Power Apps 中调用功能,上传 PDF 并查看提取结果
- 关键参数设置与常见问题避坑指南
1. 环境准备与镜像部署
要让 Power Platform 能解析 PDF 文件,必须先部署能够真正解析内容的服务。我们不需要从头搭建,使用预配置好的镜像即可运行起来。
1.1 找到并部署 PDF-Extract-Kit-1.0 镜像
打开 AI 模型仓库,搜索关键词 "PDF-Extract-Kit" 或直接查找模型名为 PDF-Extract-Kit-1.0 的镜像。这是一个专为复杂 PDF 解析设计的 AI 工具包,集成了 LayoutLMv3、StructEqTable 等多个先进模型,具备以下核心能力:
- 布局检测:自动识别标题、段落、表格、图片等区域
- OCR 增强:即使面对低质量扫描件也能提取清晰文字
- 表格还原:支持将表格转换为 Markdown / HTML / LaTeX 格式
- 公式识别:可提取数学表达式并保留结构信息
- 多语言支持:对中文文档有专门优化,识别更准确
选择该镜像后,点击'一键部署'。平台会自动分配 GPU 资源(建议选择至少 16GB 显存的实例类型,如 V100 或 A10G),并在后台拉取镜像、安装依赖、启动服务。
⚠️ 注意 部署过程中请确保选择了'对外暴露服务端口'的选项,默认服务运行在
8503端口。部署成功后,你会获得一个公网可访问的 URL 地址,形如:http://<your-instance-ip>:8503
这个 URL 就是将在 Power Automate 中调用的核心接口地址。
1.2 验证服务是否正常运行
部署完成后,先确认服务本身能不能用。我们可以用浏览器或命令行简单测试一下。
打开任意终端工具(如 Windows PowerShell 或 Mac Terminal),执行以下命令:
curl -X POST http://<your-instance-ip>:8503/predict \
-H "Content-Type: multipart/form-data" \
-F "file=@./sample.pdf"
把 <your-instance-ip> 替换成你实际的 IP 地址,sample.pdf 换成本地任意一个 PDF 文件路径。如果返回的是 JSON 格式的结果,包含 text, tables, images 等字段,说明服务已经跑通了!
返回示例片段如下:
{
"text": "第一章 引言...\n本研究旨在探讨...",
"tables"

