一、背景:无接口 ERP 数据采集的痛点
企业数字化转型中,ERP 系统(金蝶 K/3、用友 U8/NC)是核心数据载体,但多数中小企业面临一个共性问题:ERP 系统无开放 API 接口,或接口权限申请流程繁琐、成本高,无法通过常规接口调用获取数据。
传统的解决方案(人工手动导出 Excel)存在效率低、易出错、无法实时采集的问题;而单纯的爬虫技术又无法应对 ERP 系统的'桌面客户端操作''多层菜单导航''动态加载表格'等场景。此时,Python RPA(机器人流程自动化)+ 爬虫的组合方案成为最优解——用 RPA 模拟人工操作 ERP 界面(点击、输入、翻页),用爬虫/数据提取技术抓取界面数据,既符合 ERP 系统的操作逻辑,又能实现数据的自动化采集,实测可将人工采集效率提升 10 倍以上。
本文针对金蝶 K/3(Windows 客户端)和用友 U8(网页版)两种典型无接口场景,实现一套通用的 Python RPA 采集方案,覆盖登录、导航、查询、数据提取全流程,兼顾稳定性和合规性。
二、核心原理:RPA+ 爬虫适配 ERP 的底层逻辑
ERP 系统的操作本质是'固定流程 + 可视化界面交互',RPA+ 爬虫的核心思路是:
- RPA 层:模拟人工的键鼠操作、界面导航,解决'如何打开 ERP、定位功能模块、执行查询操作'的问题;
- 数据提取层:针对 ERP 的表格/表单界面,通过截图识别、控件读取、网页 DOM 解析等方式提取数据,替代人工复制粘贴;
- 适配层:


