大模型在智能财务领域的应用思路与落地实践
1. 大模型的实践背景
在财务智能审核、记账、分析领域,企业长期面临两个核心痛点:一是'用人成本与岗位价值'不匹配,二是'业务流程与管理所需'不匹配。要彻底解决这两个问题,必须达成'三高'——高质量且全面的数据结构化、高标准且专业的规则自动化、高效率且灵活的运营数字化。
然而,在实现'三高'的过程中,传统技术路径存在两个主要卡点:
- 非标票据定向数据结构化难:财务审核的票据类型繁杂,尤其是酒店水单、手写收据等非标准票据。OCR 技术难以处理格式多变、字迹潦草的情况,导致指定信息提取困难。
- 系统自动理解纸面规则难:财务审核规则动态多变,将纸面上的规则话术转化为可执行的系统逻辑成本高,修改纸面规则往往需要重新配置系统,响应滞后。
这两个卡点导致系统自动化率难以达到 100%,部分环节仍需人工介入。早期的解决方案通常采用工具化应用提供生产力转换,例如通过众包平台处理 OCR 无法识别的票据,或通过规则引擎由交付团队配置复杂规则。但这并非终点,真正的目标是产品担负起全量生产力的输出,所有功能环节不依赖人的介入。大模型的出现为解决上述技术卡点提供了新的创新实践路径。
2. 大模型在智能财务领域的应用思路
大模型的能力要应用在智能财务,核心逻辑是'用强弃弱',即找到大模型和智能财务工作的最佳结合点。
2.1 智能财务流水线脉络
为了理解结合点,可以参考'三横一纵'智能财务流水线架构:
- 第一横:智能财务实务操作线(如报销、付款)。
- 第二横:智能财务业财融合线(业务数据与财务数据打通)。
- 第三横:智能财务风险管控线(合规性检查)。
- 一纵:智能财务管理支撑线(数据分析、决策支持)。
2.2 大模型应用的'四阶梯'评估
基于上述架构,可以将大模型在智能财务中的应用效果分为四个阶梯:
- 第一阶梯(效果好):智能提单和智能审单。大模型擅长语义理解和非结构化数据处理,可以足量发挥优势,替代大量人工录入和初审工作。
- 第二阶梯(效果一般):智能记账、智能风控、智能税务和数据池。这些场景涉及复杂的业务逻辑和多源数据整合,大模型目前表现尚可但需辅助校验。
- 第三阶梯(不足):司库管理、BI 分析。现阶段大模型对深度业务推理和实时数据聚合能力尚显不足。
- 第四阶梯(难以供给):智能报表、管理驾驶舱、业财一体。大模型暂时难以快速供给能量完成全盘优化,但在搜索体验等交互层面仍有结合空间。
2.3 强弱项分析
大模型的优势在于远超人类个体的渊博常识、人机对话能力以及自我进化的涌现性;劣势在于不了解大多数企业的具体业务流程、缺乏领导人格魅力、对多领域知识结合推理的认知较浅。
因此,偏常识、偏技能、偏沟通的财务工作,大模型几乎都可以完美赋能;而偏流程、偏业务、偏管理的事情,大模型表现得比较挣扎。市面上的大模型训练集中没有每家公司具体的运营条款、人力制度、财务规则,这些数据对大模型属于 OOD(Out-of-Distribution,分布外)数据。指望它全盘优化公司财务是不现实的,投入过大且试错成本高。务实的做法是优先让大模型介入财务提单、审单,这是能大范围替代人工的环节。
3. 大模型在非标票据定向数据结构化上的落地实践
非标票据定向数据结构化,是指对没有固定格式的票据中的特定信息做数据结构化处理。例如维修清单,各家修理厂格式各异,但企业需要的信息通常是维修单位、事项、日期、金额、签章等字段。这要求从成千上万种格式中找到财务需要的信息并做结构化转换。
对于传统 OCR 而言,这是非常困难的。大模型为此带来了天翻地覆的变化,实现了高精度输出置信度的同时,大幅提升了灵活性。
3.1 实践方法论
实现这一目标通常遵循以下五步法:
- 双模型调用策略:调用两个大模型,一个用于语料拆解和上下文位置抓取,另一个用于语料重新组装和结构化输出。这种分工提高了处理的精准度。
- 训练集构建:训练集来源于沉淀多年的众包补录数据。利用'一问一答'的对话逻辑引导数据提取,这种对话式训练集利于大模型吸收知识。使用 GAN(生成对抗网络)基于真实数据生成虚拟对话数据,以规避隐私问题。
- :为训练集匹配提示词工程和标注脚本,完成众包数据、校准数据和数据所在票据位置的三者关系匹配,让大模型掌握在票据何处能找到结构化数据。


