AI 大型语言模型在商业智能（BI）领域的实际应用 | 极客日志

SQLSaaSAI算法

AI 大型语言模型在商业智能（BI）领域的实际应用

AI 大型语言模型正在重塑商业智能（BI）领域。探讨了 AI 与 BI 结合的三种查询模式（Text-to-API、Text-to-SQL、Text-to-Code）及三种呈现模式（文本报告、可视化模板、交互助手）。分析了实施中的挑战如幻觉、数据安全及性能问题。通过网易有数、京东 ChatBI、百度 SugarBI 等案例展示了实际落地方案。最后总结了从问题定义到决策行动的全链路 AI 赋能可能性，指出未来将向更成熟稳定的版本演进。

CodeArtist发布于 2025/2/7更新于 2026/7/2134 浏览

引言

BI（商业智能，Business Intelligence）涉及利用软件工具和系统分析企业内外的原始数据，以便更快速、更精确地做出决策。像这样的 BI 产品已经是一个相当成熟的应用领域。例如 Tableau、帆软 FineBI、微软 PowerBI、永洪 BI、观远数据、思迈特 Smartbi、阿里云 Quick BI 等 AI 与 BI 结合的商业智能工具，部分读者可能已经有所了解或实际使用过。

AI 与 BI 结合的实际应用案例

商业智能工具的主要功能包括数据仓库、数据挖掘、报告编制以及在线分析处理（OLAP），这些功能协助企业洞察市场趋势，评估业务流程的效益，并发现新的增长机遇。

AI 与 BI 结合架构示意

随着 AI 技术的日益发展，AI 结合商业智能已经崭露头角，这个新兴领域主要是将 AI，特别是机器学习和大型语言模型技术，融入到商业智能系统中，以实现数据分析和决策过程的自动化和增强。

特别地，我们将深入探索 AI 与 BI 结合的实践，借助 AI 大型语言模型构建对话式智能报表系统。利用 AIGC 技术，我们可以实现更高效的数据处理和决策。通过 AI 与 BI 结合，我们的对话式智能报表系统可以让用户通过对话方式完成数据探索和报表制作等工作，从而极大地提升了数据分析效率。改造商业智能产品的人工智能交互方式。

对话式智能报表系统

我认为 AI 与 BI 结合是一个具有实际应用场景和价值的方向。虽然从可用资源和投入产出比的角度来看，我们目前还不适合推动这个方向。

资源投入评估

重要的是，本文后续提到的 AI，特别是指基于大型语言模型（LLMs）的自然语言处理能力——也就是对话式系统交互的支持。在商业智能领域，除了大型语言模型外，还有其他的 AI 技术可以使用。例如，机器学习技术可以被用于销售预测。

从 AI 产品经理的视角来看，AI 大型语言模型与商业智能结合在数据分析应用中具有以下优势：

自然语言处理与理解：AI 大型语言模型的强大自然语言处理功能，让用户可以使用他们熟悉的语言来查询和分析数据。这极大地降低了数据分析的学习难度，使得非技术背景的用户也能轻松掌握。同时，AI 大型语言模型还能处理和分析非结构化数据，比如客户的评价和媒体内容，从而获取有价值的信息和洞察力，为企业提供全面的数据视角。
智能推理与预测：借助 AI 与 BI 结合，对话式智能报表系统能够进行智能推理和预测。这种结合不仅提供了数据的深度洞察，而且还能预测未来的趋势，为企业的决策提供强大的支持。AI 大型语言模型不仅能够处理现有的数据，还具备基于现有数据进行推理和预测的能力。这意味着，它可以协助用户识别数据中的异常点、趋势以及潜在的问题和机会，为企业决策提供有力的支持。这种能力对于商业智能领域的企业来说极其宝贵，因为它可以帮助企业预测市场变化，提前做好准备。
代码生成和自动化：在 AI 与 BI 结合的领域，对话式智能报表系统也能实现代码的自动生成和自动化。AI 大型语言模型能够理解和生成代码，这极大地提升了开发效率，降低了开发难度。不仅如此，AI 大型语言模型还能够自动化执行一些重复的任务，进一步提升工作效率。AI 大型语言模型具有通过自然语言指令生成 Python、R 等编程语言代码的能力，这大幅度降低了技术入门难度，使得无编程背景的用户也能够执行复杂的数据分析任务。这种自动化的代码生成功能，既提升了数据分析的效率，又扩展了数据分析的应用领域。
：在 AI 与商业智能结合的领域中，大型语言模型的运用为我们打造出了新的互动方式。在我们的对话式智能报表系统中，用户可以直接通过自然语言进行查询和操作，无需复杂的编程技能，大大提升了用户体验和工作效率。这种新的互动形式不仅简化了数据分析过程，更让数据分析变得触手可及，无需专门的技术背景。利用大型语言模型，我们引入了基于语言的交互方式，这种方式更直观、自然。用户无需学习复杂的软件操作，只需用自然语言表达查询需求。这不仅提升了用户体验，也使得我们的对话式智能报表系统能更好地融入用户的工作流程中。

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
SQL 美化和格式化
在线格式化和美化您的 SQL 查询（它支持各种 SQL 方言）。在线工具，SQL 美化和格式化在线工具，online

理解数据的精确性：如果 LLM 的训练数据中缺乏充足的行业特定知识或上下文信息，模型可能会面临理解复杂业务数据的困难。因此，大型语言模型可能在理解复杂数据集、特定行业术语或上下文中的微妙差异方面面临挑战。这可能导致对数据分析结果的误解或错误解读。
幻觉问题：在生成文本时，大型语言模型可能会出现'幻觉'，也就是创造出与实际数据不相符的信息。在商业智能报告中，这可能会引发数据洞察和结论的不准确或误导。这是因为大型语言模型在生成文本时，可能会根据其训练数据中的模式进行推断，而这些模式可能并不总是能准确反映实际情况。
数据安全与隐私保护：在运用大型语言模型处理敏感或私密数据时，保护数据不被非法访问或泄露是至关重要的。特别是在 LLM 的云基础设施和 API 调用环节，这些可能成为数据安全的风险点，尤其是在处理敏感信息时。
大型语言模型的通用性与个性化需求：尽管大型语言模型拥有强大的通用性，但在应对特定行业或复杂数据分析任务时，可能无法满足所有定制化需求。这是因为大型语言模型的训练基于广泛的数据集，可能无法全面覆盖某些特定领域或复杂场景的细节和特性。
用户体验交互：我们需要保证大型语言模型能够提供自然、流畅的交互体验，同时准确把握用户的查询意图和需求，这可能面临挑战。面对用户查询方式和习惯的多样性，我们的对话式智能报表系统需要具备强大的适应性和灵活性。自然语言处理的复杂度，可能会对交互的精确性和用户体验产生影响。
实时性和性能：在需要实时反馈的商业智能应用中，保证大型语言模型提供的方案能满足性能和即时性需求可能会遇到困难。这是因为在 AI 与商业智能结合的领域，我们的对话式智能报表系统可能会面临大型语言模型的计算资源和处理时间需求，尤其是在处理大规模数据集或复杂查询时。这可能会对系统的性能和实时反馈能力产生挑战。

知识库的创建和使用：在京东的 ChatBI 项目中，利用 Langchain 开发了大型语言模型，并构建了一个包含两大类资产的知识库。这两大类资产分别是数据中台资产和业务资产。数据中台资产包括元数据、指标 SQL 以及产品指南等，为模型提供了丰富的数据支持。业务资产部分，则主要包括针对特定业务场景构建的模型和累积的业务知识。特别的是，注重分析师的分析思路，这些思路通常难以标准化和复用。但是，通过 AI 大型语言模型，现在可以将分析师的专业思路转化为机器可以学习和自动化使用的形式，从而极大地提升了业务分析的效率和广度。
关键技术实力：在用户与 ChatBI 交互过程中，系统首先运用意图识别技术，理解用户的查询目标，如获取特定知识、进行数据分析，或是简单的对话交流。然后，通过实体识别技术，从用户的提问中抽取关键信息，如时间、指标和维度等，并结合用户的背景信息，如权限和部门，以实现更精确的解析。对于知识查询类问题，系统与知识库交互，并通过优化算法提升回答效率。而在数据分析场景下，ChatBI 会调用相应接口，将问题传递给大模型进行深度分析，并最终生成直观的可视化结果。在我们之前讨论的'模式'中，这里采用的是【Text-to-API】模式。而在生成自然语言文本报告、动态可视化模板报告以及交互式数据探索助手等功能时，也都应用了这种模式。
提升工作效率的应用案例：ChatBI 的应用显著提高了工作效率。过去，当用户遇到数据问题时，可能需要跨平台搜索指标定义，进行复杂的数据分析流程，耗时可能长达数小时甚至数天。而现在，用户只需通过与 ChatBI 的自然语言交流，就能迅速获取问题的答案和可视化分析结果。这种以对话形式进行的高效数据交互和分析，极大地简化了数据分析流程，使得决策支持更加快速和精确。

AI 问数：在 SugarBI 平台，用户可以通过多种方式提出数据需求，包括通过报表、大屏以及探索页等多个入口。用户可以选择语音、自然语言输入或是直接拖拽字段等多种交互方式来提问。对于语音输入，SugarBI 通过 ASR 技术将语音转化为文本，再通过 NLP 技术将其转化为具体的数据查询需求，充分展示了该平台对用户需求表达方式的全面适应能力。 SugarBI 的一个核心特性是其表格问答模型，这个模型能够理解用户的自然语言查询，并将其转换为具体的数据需求。这个过程得益于 SugarBI 背后的数据模型，它有效地抽象了数据宽表的结构（Schema）和同义词等配置，以便进行深度的模型训练和部署。这种智能处理不仅提升了数据查询的准确性，也为用户提供了更直观和灵活的数据分析体验。经过智能处理，用户的查询需求在 Sugar BI 中得到了满足。BI 会自动将这些转换为图表配置，并生成相应的 SQL 语句进行数据查询。这个过程展示了从需求捕获到数据检索的无缝链接，显著提升了数据处理的效率。获取的数据将根据其特性，由 SugarBI 的智能图表功能自动匹配到最合适的图表类型，从而生成直观且内容丰富的数据可视化结果。（text-to-SQL+ 动态可视化模板报告模式）
自动数据分析功能：
- 数据预处理与分析准备：在启动自动数据分析之前，SugarBI 首先确定分析的数据范围，即选定特定的数据字段集合。接着，SugarBI 会详细审查这些字段的配置和数据细节，以确保分析的准确性。值得注意的是，SugarBI 在这个阶段会遵循设定的用户权限规则，确保数据访问的合规性。在进行表格分析时，系统会根据报表设定的用户权限进行权限检查和数据过滤，以防止越权行为发生。
- 模型运作分析：在收集完必要的信息后，SugarBI 将这些数据输入到自动分析模型中。这个模型基于 SugarBI 内部大量报表数据进行训练，因此具备强大的分析能力。模型主要提供两类关键信息：一是对数据过滤条件的优先级排名，二是对图表展示字段组合的推荐排名。
- 图表的创建与优化：根据模型的推荐，SugarBI 将自动创建相应的数据过滤条件和图表展示字段组合。在这个过程中，我们的对话式智能报表系统会利用智能图表功能来推荐最适合的图表类型，以最直观的方式展示数据。生成的图表和过滤条件将相互关联，为用户提供了灵活的数据探索能力，如下钻和筛选等。
- 自动排版报表：最后，SugarBI 会自动对选定的过滤条件和图表进行排版，生成最终的报表。这意味着，从选择数据到生成报表的整个分析流程，都由 SugarBI 的自动分析功能智能化地完成，极大地提升了分析效率和用户体验。

1. 获取用户的自然语言查询需求，如'各品牌的退款额分别是多少'；
2. 将用户的查询需求转化为机器可理解的 SQL 语句，
   例如 "SELECT `品牌名称`, SUM(`退款金额`) AS `退款额` FROM input1 GROUP BY `商品名称`"
   返回生成的 SQL 查询语句给用户；
3. 进一步交互式的追问，例如'再加上渠道维度'；
4. 再次将其转化为 SQL 语句，
   例如 "SELECT `商品名称`, `渠道`, SUM(`退款金额`) AS `退款额` FROM input1 GROUP BY `商品名称`, `渠道`"
   并返回给用户。

智能分析：利用大型语言模型理解用户需求，自动设置分析模型以事件分析为例，如果您在输入框中用自然语言输入需要获取的数据指标，例如"最近 7 天的搜索点击用户数"，AI 大型语言模型会将这个自然语言查询转化为请求查询 JSON，然后发起查询，并以图形的形式展示结果。在此，神策团队选择了 text-to-json 模式，而非 text-to-SQL 模式，主要基于两个考虑：一是这种模式更易于理解，便于业务人员判断查询；二是这种模式更便于人为干预，例如，如果生成的查询 JSON 不准确，或是想改变计算方式或查询条件以查看指标变化，都可以快速调整。其实现流程大致如下：首先，将 schema（简单来说，它是关于数据的存储方式、数据间的关系以及数据的解释信息）输入到 GPT 中，首先，我们需要将数据的 schema（即数据的存储方式、数据间的关系以及数据的解释信息）输入到 GPT 中，让 GPT 理解数据的 schema 和任务。由于存在长度限制，我们需要进行优化设计，从报表的众多字段中筛选出进入到 prompt 的字段，以缩短 prompt。接下来，由于筛选出的 schema 会包含许多字段，过多的字段可能会影响 GPT 的准确率和精度。因此，我们需要与 GPT 进行交互，让其挑选出与需求相关的字段。最后，通过 AI 大型语言模型生成 JSON。对于复杂的查询，我们可以先让模型生成一个结构，然后再填充具体的内容。神策分析 Copilot 特别注重可理解性、可信赖性和可干预性，有效地避免了大型语言模型常见的幻觉问题。在生成分析结果的同时，Copilot 会展示分析模型和指标的应用来源，使用户能够理解并验证分析逻辑和指标用法，确保用户选择正确的指标。如果分析结果不满足预期，用户可以手动调整，帮助系统持续学习并优化结果，即显式反馈。
指标搜索：通过自然语言查询常规指标借助大型语言模型技术，我们打造了强大的指标搜索功能，使业务人员能够迅速找到当前关注的指标和经营概览，或深入探索特定业务的相关指标。用户可以使用口语化输入，无需输入专业术语或精确的指标名称，也能获取相关的数据指标。例如在零售领域，假设用户想了解近期的商品销售数据，他们只需向 Copilot 提出'卖得最好的商品'这样的问题，Copilot 就会推送'当天销售最好的商品'、'访问量最高的商品'、'商品销售数量'等相关指标的查询结果，无需专业的数据分析师进行操作。
数据门户融合：数据仓库对话插件神策分析 Copilot 也能够接入企业数据仓库例如，在某保险公司的实际应用中，该系统作为一个智能问答组件，已成功融入公司的数据门户。用户只需点击"智能问答"，就可以直接与系统对话，进行自助式的数据分析和查询，生成数据结果和报表。