大语言模型在审计工作中的应用场景
随着人工智能应用的不断扩展,审计人员如何有效地利用人工智能来辅助审计工作,已成为一个亟待解决的重要课题。在审计工作的数字化转型中,建立支持人工智能应用的数字化平台是核心任务。探索大语言模型(Large Language Model, LLM)在审计工作中的应用具有紧迫的现实需求和广阔的发展前景。
本文探讨了大语言模型在审计全流程中的应用,涵盖对象监测、计划制定、实施、复核及审后跟踪等六个阶段。介绍了基于检索增强生成(RAG)和微调技术构建审计专用模型的方法,强调了数据清洗、提示词工程及人机协同的重要性。文章分析了如何利用 LLM 提升审计效率与深度,同时指出了数据安全与合规性挑战,为审计数字化转型提供了技术路径参考。

随着人工智能应用的不断扩展,审计人员如何有效地利用人工智能来辅助审计工作,已成为一个亟待解决的重要课题。在审计工作的数字化转型中,建立支持人工智能应用的数字化平台是核心任务。探索大语言模型(Large Language Model, LLM)在审计工作中的应用具有紧迫的现实需求和广阔的发展前景。
基于计算机技术与深度学习的集成,人工智能模仿人类大脑的认知系统,执行比拟人类智能的任务。生成式人工智能是人工智能模型的一个子集,此类模型能够从海量训练数据中学到一系列模式并依据概率生成新的内容,例如文本、图像、音频和视频数据。大语言模型(LLM),如智谱清言、文心一言、ChatGPT等,是生成式人工智能在自然语言处理(NLP)领域的典型应用。这些模型不仅理解和分析文本,还根据它们在训练期间学到的模式和结构生成类似人类的文本。LLM 在理解自然语言和解决复杂任务方面表现出强大的能力,可用于识别、总结、翻译、逻辑推理和生成文本。
现阶段,教育、医疗、法律、会计等垂直领域多场景专业大语言模型运用已成为趋势。应用于审计场景的专业大语言模型正在发展中,审计机关、高校都在展开探索。
本文将审计工作划分为六个阶段,分别论述 LLM 的可能应用及具体技术路径。
'跳出审计看审计、跳出审计干审计'是深化研究型审计的内生要求。加强对审计对象及其业务的研究已成为审计系统的共识。以区域审计为例,沿着'政治 - 政策 - 项目 - 资金'主线,收集形成覆盖全域审计对象的机构、政治、政策、项目、资金相关的多模态数据。借助大语言模型来分析这些多模态数据,可以对区域经济、企业、投资、旅游等情况有个全面掌握,逐步形成区域态势感知。
技术实现示例:
结合对审计对象的监测,LLM 可以通过对历史审计数据的学习和分析,推测本年度审计对象、审计事项的优先情况,为合理配置审计资源提供支持。如对党和国家重大决策部署政策文件、审计工作指导性文件、本地规划工作方案等进行情感和主题建模等分析,研判党中央对审计署及地方各级审计机关的要求、本地经济社会运行中的重大事项等。通过预测性分析,帮助制定更科学的年度审计项目计划。
在编制实施方案之前,审计人员对被审计单位的基本情况、相关内部控制及其执行情况、财政财务情况、信息系统控制情况等进行了解和审查,可利用 LLM 协助评估被审计单位可能存在的问题,确定审计事项和审计应对措施。在注册会计师审计、内部审计中,运用 LLM 对审计对象及业务情况进行分析,并拟定审计内容和重点,已处于实际运用探索中。
这是审计人员利用 LLM 发挥作用的主要场景。通过嵌入数据分析、文本阅读等插件,LLM 可以处理和分析大量的结构化和非结构化数据。这些数据包括财务报表、交易记录、政策文件、会议记录等,都是审计过程中的关键信息来源。
核心功能:
在复核审理阶段使用大语言模型可以显著提高审计工作的效率和准确性。
利用数据挖掘技术如 SVM、ANN 和 KNN 建立预测分类模型,为整改分类(如分为资金问题、项目问题、管理问题、政策问题)和整改力度(如分为立行立改、阶段性整改、长期整改)提供依据。根据被审计单位的整改情况,对比审计组提出的审计建议,形成整改情况全局展示图,突出整改重点,分析整改难点。收集审计整改情况,运用 LLM 来分析评判整改工作是否实现了期望目标,评估审计整改效果。
根据收集到的数据,我们可以进行如下几个方面的工作,以构建适用于审计场景的专用系统。
首先,对数据进行清洗和整理构建当地审计的语料库。该语料库由政策文本、审计报告、审计案例等文本数据组成,同时包含由资金链条相关的格式化数据。
使用已有的 LLM,结合检索增强生成技术(Retrieval-Augmented Generation, RAG)和 AI Agents,搭建一个适用于审计场景的审计系统。这包括审计常识的问答场景、审计报告分析场景、审计问题发现场景等。
在语料库充足的基础上,可以使用模型微调技术,对现有的 LLM 进行微调,构建一个更适合本地审计应用的 LLM。
参考 AutoGPT 等框架的思路,针对一个审计问题让 LLM 自问自答,基于 LLM 的逻辑推理能力,先描述解决问题的整体思路,再让 LLM 去分解任务,并将每个细分的子任务让 LLM 继续分析和分解,直到分解成传统机器学习可以完成的任务,或者是数据库查询比对任务,直到任务完成。
值得注意的是数据可视化贯穿数据分析全过程,是一项不可或缺的数据分析能力。LLM 将使得数据分析和可视化更加智能、便捷,也对审计人员的数据认知素养提出更高要求。不仅需要仔细考量对 LLM 的提示词(Prompt)是否有效合理,还需要对其输出进行专业解释,最终决定是否采纳其提供的建议。
审计数据通常涉及敏感信息,在使用 LLM 时必须确保数据隐私和安全。私有化部署本地化 LLM 是保障数据安全的重要手段。同时,需警惕模型幻觉(Hallucination)带来的风险,特别是在生成审计结论时,必须有人工复核机制。
只有审计人员与 LLM 形成一个不断迭代、持续互动的有机体,才能充分释放大语言模型的强大创造力以及审计人员特有的敏锐洞察力、深层次判断力。未来的审计将是'专家 +AI'的模式,AI 负责处理海量数据和初步分析,专家负责价值判断和决策。
大语言模型为审计工作带来了革命性的变化,从数据采集、分析到报告生成的全链路优化,显著提升了审计效率和质量。然而,技术的落地仍需克服数据质量、模型精度、安全合规等多重挑战。随着技术的成熟和生态的完善,审计专用大模型将成为审计数字化转型的核心驱动力。

微信公众号「极客日志」,在微信中扫描左侧二维码关注。展示文案:极客日志 zeeklog
使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online
生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online
基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。 在线工具,curl 转代码在线工具,online
将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online
将字符串、文件或图像转换为其 Base64 表示形式。 在线工具,Base64 文件转换器在线工具,online