低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform 实战 | 极客日志

编程语言AI算法

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform 实战

综述由AI生成一种基于低代码平台的 PDF 文档自动化处理方案。通过部署开源 AI 模型 PDF-Extract-Kit-1.0，利用 Power Automate 创建自定义连接器封装 API 接口，并在 Power Apps 中构建前端应用实现文件上传与结果展示。该方案支持文本、表格及公式的精准提取，适用于发票信息自动录入、合同条款审查及学术知识库构建等场景。文中还涵盖了服务部署验证、参数配置、安全性建议及性能优化策略，帮助业务人员无需编写后端代码即可快速搭建智能文档处理系统。

颠三倒四发布于 2026/4/6更新于 2026/5/2026 浏览

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform

在处理企业文档时，大量 PDF 格式的合同、发票、报告需要处理。手动复制粘贴费时费力且易出错，而开发完整的自动化系统又过于复杂。本文介绍一种无需编写后端代码的方法，将 AI 驱动的 PDF 解析能力集成到 Power Apps 应用中。

PDF-Extract-Kit-1.0 是开源社区中表现出色的 PDF 内容提取工具之一。它能精准识别文本、表格、图像和公式，理解文档布局结构，即便是扫描件或模糊文件也能保持高准确率。模型支持一键部署为 HTTP 服务，便于通过 Power Automate 调用。

本文将带你实现：

快速部署 PDF-Extract-Kit-1.0 镜像并启动 API 服务
在 Power Automate 中封装该服务为自定义操作
在 Power Apps 中调用功能，上传 PDF 并查看提取结果
关键参数设置与常见问题避坑指南

1. 环境准备与镜像部署

要让 Power Platform 能解析 PDF 文件，必须先部署能够真正解析内容的服务。我们不需要从头搭建，使用预配置好的镜像即可运行起来。

1.1 找到并部署 PDF-Extract-Kit-1.0 镜像

打开 AI 模型仓库，搜索关键词 "PDF-Extract-Kit" 或直接查找模型名为 PDF-Extract-Kit-1.0 的镜像。这是一个专为复杂 PDF 解析设计的 AI 工具包，集成了 LayoutLMv3、StructEqTable 等多个先进模型，具备以下核心能力：

布局检测：自动识别标题、段落、表格、图片等区域
OCR 增强：即使面对低质量扫描件也能提取清晰文字
表格还原：支持将表格转换为 Markdown / HTML / LaTeX 格式
公式识别：可提取数学表达式并保留结构信息
多语言支持：对中文文档有专门优化，识别更准确

选择该镜像后，点击'一键部署'。平台会自动分配 GPU 资源（建议选择至少 16GB 显存的实例类型，如 V100 或 A10G），并在后台拉取镜像、安装依赖、启动服务。

⚠️ 注意部署过程中请确保选择了'对外暴露服务端口'的选项，默认服务运行在 8503 端口。部署成功后，你会获得一个公网可访问的 URL 地址，形如：http://<your-instance-ip>:8503

这个 URL 就是将在 Power Automate 中调用的核心接口地址。

1.2 验证服务是否正常运行

部署完成后，先确认服务本身能不能用。我们可以用浏览器或命令行简单测试一下。

打开任意终端工具（如 Windows PowerShell 或 Mac Terminal），执行以下命令：

curl -X POST http://<your-instance-ip>:8503/predict \
  -H "Content-Type: multipart/form-data" \
  -F "file=@./sample.pdf"

把 <your-instance-ip> 替换成你实际的 IP 地址，sample.pdf 换成本地任意一个 PDF 文件路径。如果返回的是 JSON 格式的结果，包含 text, tables, images 等字段，说明服务已经跑通了！

返回示例片段如下：

{
  "text": "第一章 引言...\n本研究旨在探讨...",
  "tables"

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

参数名	类型	说明
`file`	file	必填，上传的 PDF 文件
`output_format`	string	可选，指定表格输出格式：`markdown`, `html`, `latex`
`with_ocr`	boolean	是否强制启用 OCR（适合扫描件）
`detect_tables`	boolean	是否检测并提取表格
`detect_formulas`	boolean	是否识别数学公式

curl -X POST http://<your-ip>:8503/predict \
  -F "file=@financial_report.pdf" \
  -F "output_format=markdown" \
  -F "detect_tables=true"

参数名	类型	必需	示例值	描述
file	File	是	sample.pdf	要解析的 PDF 文件
output_format	String	否	markdown	表格输出格式
detect_tables	Boolean	否	true	是否检测表格
with_ocr	Boolean	否	true	是否启用 OCR

Set( pdfResult, 'PDF Extract Kit 1.0'.ExtractPDFContent( FilePicker1.Selected.File, "markdown", true, true ) )

pdfResult.text

ClearCollect( ParsedTables, ForAll( Split(pdfResult.tables, "|||"), // 假设多个表格用分隔符隔开 { TableMarkdown: ThisRecord.Value } ) )

Split(pdfResult.images, ",")

Set(isLoading, true); Set(pdfResult, 'PDF Extract Kit 1.0'.ExtractPDFContent(...)); Set(isLoading, false)

If( IsError(pdfResult), Notify("解析失败，请检查文件格式或网络连接", NotificationType.Error), Notify("解析成功！", NotificationType.Success) )

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform 实战

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform

1. 环境准备与镜像部署

1.1 找到并部署 PDF-Extract-Kit-1.0 镜像

1.2 验证服务是否正常运行

更多推荐文章

相关免费在线工具

1.3 了解关键接口与参数配置

1.4 安全性与访问控制建议

2. 在 Power Automate 中封装 API 调用

2.1 创建自定义连接器

2.2 配置连接参数与身份验证

2.3 添加'Extract PDF Content'操作

2.4 发布并授权连接器

3. 在 Power Apps 中调用并展示结果

3.1 创建新的 Canvas App

3.2 添加控件布局

3.3 绑定自定义连接器

3.4 展示提取结果

显示文本内容

解析并展示表格

图片预览（可选）

3.5 添加加载状态与错误提示

4. 实际应用场景与优化技巧

4.1 场景一：自动提取发票信息

4.2 场景二：合同关键条款提醒

4.3 场景三：学术论文知识库构建

4.4 性能优化与成本控制

总结

更多推荐文章

相关免费在线工具

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform 实战

低代码集成：将 PDF-Extract-Kit-1.0 接入 Power Platform

1. 环境准备与镜像部署

1.1 找到并部署 PDF-Extract-Kit-1.0 镜像

1.2 验证服务是否正常运行

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 了解关键接口与参数配置

1.4 安全性与访问控制建议

2. 在 Power Automate 中封装 API 调用

2.1 创建自定义连接器

2.2 配置连接参数与身份验证

2.3 添加'Extract PDF Content'操作

2.4 发布并授权连接器

3. 在 Power Apps 中调用并展示结果

3.1 创建新的 Canvas App

3.2 添加控件布局

3.3 绑定自定义连接器

3.4 展示提取结果

显示文本内容

解析并展示表格

图片预览（可选）

3.5 添加加载状态与错误提示

4. 实际应用场景与优化技巧

4.1 场景一：自动提取发票信息

4.2 场景二：合同关键条款提醒

4.3 场景三：学术论文知识库构建

4.4 性能优化与成本控制

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具