一、引言
财务报告分析是企业运营管理、投资决策制定及风险评估的核心环节。然而,传统财务分析流程普遍存在效率瓶颈:分析师需要从 PDF 年报、Excel 表格等多样化数据源中手动提取、清洗和整合数据,这个过程既耗时又容易出错。
基础财务指标计算、趋势分析及初步风险识别等任务涉及大量重复性操作,限制了分析师投入高价值战略性工作的时间。此外,人工分析容易受个人经验和判断影响,可能导致分析结果缺乏一致性和客观性。
近年来,人工智能技术特别是大型语言模型(LLM)与智能体(Agent)的快速发展,为解决这些挑战提供了新的技术范式。本文将介绍如何利用 LazyLLM 框架,构建一个专用于财务分析的 Agent,实现从原始财务文件到生成结构化财务健康报告及投资风险点的端到端自动化处理。
二、LazyLLM 架构简述与 Agent 设计
2.1、LazyLLM 架构简述
LazyLLM 是由商汤科技研发的一站式多 Agent 大模型应用开发框架,旨在为开发者提供方便、高效的环境来构建复杂的 AI 应用。其核心技术之一是检索增强生成(Retrieval-Augmented Generation, RAG),RAG 通过引入一个外部知识库,有效地扩展了 LLM 的知识边界。
当用户提出一个问题时,RAG 系统首先会利用用户的查询,从一个预先构建好的知识库(例如,包含公司年报、行业报告、新闻文章等的文档集合)中检索出最相关的文档片段,然后,这些检索到的文档片段会与用户的原始查询一起,作为上下文(context)输入到 LLM 中,最后,LLM 基于这些提供的上下文信息,生成最终的回答。

通过这种方式,RAG 确保了生成的内容有据可依,大大提高了回答的准确性、可靠性和时效性。在财务分析场景中,RAG 技术尤为重要。例如,当分析师询问'上汽集团 2024 年的新能源汽车销量是多少?'时,RAG 系统可以从其知识库中检索到上汽集团 2024 年的年度报告,并从中提取出准确的销量数据,然后由 LLM 生成一个清晰、准确的回答,而不是凭空猜测或给出过时的信息。

LazyLLM 框架采用了高度模块化的设计,将复杂的 AI 应用拆解为一系列可复用、可组合的独立组件,其中核心的三个组件是检索器(Retriever)、生成器(Generator)和知识库(Knowledge Base)。这种模块化的架构极大地提升了开发的灵活性和效率。
- 首先,知识库(Knowledge Base)是整个系统的基础,负责存储和管理用于检索的文档数据。
- 其次,检索器(Retriever)负责根据用户的查询,从知识库中高效地检索出最相关的信息。LazyLLM 提供了多种检索策略,例如基于关键词的 BM25 检索和基于语义的向量检索,开发者可以根据具体的应用场景和数据特点,选择合适的检索算法,并配置检索返回的文档数量(top-k)等参数。
- 最后,生成器(Generator)通常是一个大型语言模型(LLM),它负责根据检索到的信息和用户的查询,生成最终的回答。LazyLLM 支持接入多种在线和离线的 LLM,如 OpenAI 的 GPT 系列、智谱 GLM、通义千问等。开发者可以通过简单的配置,指定使用的模型,并设计 Prompt 模板,以引导模型生成符合要求的、高质量的文本。
这三个核心组件通过 LazyLLM 提供的 pipeline 等流程控制工具,可以像搭积木一样灵活地组合在一起,构建出功能强大的财务分析 Agent。
2.2、财报分析 Agent 工作流设计蓝图
在设计之前,首先要明确目标。财报分析 Agent 的工作流设计蓝图涵盖数据输入与知识库构建、用户查询与意图识别、信息检索与数据提取、报告生成四个核心环节。

首先通过 LazyLLM 框架的 Document 模块加载 PDF 年报,为分析提供全面数据基础。在意图识别阶段,利用大语言模型解析用户自然语言查询,将其分解为结构化分析任务(如计算特定年份的财务指标并进行对比),并转化为 JSON 格式的可执行指令。











