AI 大型语言模型正在重塑商业智能(BI)领域。探讨了 AI 与 BI 结合的三种查询模式(Text-to-API、Text-to-SQL、Text-to-Code)及三种呈现模式(文本报告、可视化模板、交互助手)。分析了实施中的挑战如幻觉、数据安全及性能问题。通过网易有数、京东 ChatBI、百度 SugarBI 等案例展示了实际落地方案。最后总结了从问题定义到决策行动的全链路 AI 赋能可能性,指出未来将向更成熟稳定的版本演进。
CodeArtist0 浏览
引言
BI(商业智能,Business Intelligence)涉及利用软件工具和系统分析企业内外的原始数据,以便更快速、更精确地做出决策。像这样的 BI 产品已经是一个相当成熟的应用领域。例如 Tableau、帆软 FineBI、微软 PowerBI、永洪 BI、观远数据、思迈特 Smartbi、阿里云 Quick BI 等 AI 与 BI 结合的商业智能工具,部分读者可能已经有所了解或实际使用过。
随着 AI 技术的日益发展,AI 结合商业智能已经崭露头角,这个新兴领域主要是将 AI,特别是机器学习和大型语言模型技术,融入到商业智能系统中,以实现数据分析和决策过程的自动化和增强。
特别地,我们将深入探索 AI 与 BI 结合的实践,借助 AI 大型语言模型构建对话式智能报表系统。利用 AIGC 技术,我们可以实现更高效的数据处理和决策。通过 AI 与 BI 结合,我们的对话式智能报表系统可以让用户通过对话方式完成数据探索和报表制作等工作,从而极大地提升了数据分析效率。改造商业智能产品的人工智能交互方式。
我认为 AI 与 BI 结合是一个具有实际应用场景和价值的方向。虽然从可用资源和投入产出比的角度来看,我们目前还不适合推动这个方向。
重要的是,本文后续提到的 AI,特别是指基于大型语言模型(LLMs)的自然语言处理能力——也就是对话式系统交互的支持。在商业智能领域,除了大型语言模型外,还有其他的 AI 技术可以使用。例如,机器学习技术可以被用于销售预测。
智能推理与预测:借助 AI 与 BI 结合,对话式智能报表系统能够进行智能推理和预测。这种结合不仅提供了数据的深度洞察,而且还能预测未来的趋势,为企业的决策提供强大的支持。AI 大型语言模型不仅能够处理现有的数据,还具备基于现有数据进行推理和预测的能力。这意味着,它可以协助用户识别数据中的异常点、趋势以及潜在的问题和机会,为企业决策提供有力的支持。这种能力对于商业智能领域的企业来说极其宝贵,因为它可以帮助企业预测市场变化,提前做好准备。
代码生成和自动化:在 AI 与 BI 结合的领域,对话式智能报表系统也能实现代码的自动生成和自动化。AI 大型语言模型能够理解和生成代码,这极大地提升了开发效率,降低了开发难度。不仅如此,AI 大型语言模型还能够自动化执行一些重复的任务,进一步提升工作效率。AI 大型语言模型具有通过自然语言指令生成 Python、R 等编程语言代码的能力,这大幅度降低了技术入门难度,使得无编程背景的用户也能够执行复杂的数据分析任务。这种自动化的代码生成功能,既提升了数据分析的效率,又扩展了数据分析的应用领域。
新的用户体验形式:在 AI 与商业智能结合的领域中,大型语言模型的运用为我们打造出了新的互动方式。在我们的对话式智能报表系统中,用户可以直接通过自然语言进行查询和操作,无需复杂的编程技能,大大提升了用户体验和工作效率。这种新的互动形式不仅简化了数据分析过程,更让数据分析变得触手可及,无需专门的技术背景。利用大型语言模型,我们引入了基于语言的交互方式,这种方式更直观、自然。用户无需学习复杂的软件操作,只需用自然语言表达查询需求。这不仅提升了用户体验,也使得我们的对话式智能报表系统能更好地融入用户的工作流程中。
作为 AI 产品经理,理解这些 AI 大型语言模型与商业智能结合的优势,不仅有助于我们更好地利用大型语言模型技术来优化现有的对话式智能报表系统,也为我们提供了新的 BI 产品开发的灵感。我们可以探索如何将这些优势融合到商业智能产品中,以满足用户对数据查询分析和可视化展示的具体需求。
接下来,一起深入探讨 AI 大型语言模型与商业智能结合的实际应用。
AI 与商业智能结合的多元模式
在商业智能产品领域,大型语言模型(LLM)被视为现有数据分析方法的有效补充,尤其在即席数据查询、提升传统 BI 工具的能力以及简单的数据挖掘和洞察等方面。
在当前的趋势下,自然语言处理的对话式商业智能数据分析正逐渐成为主流。分析存在三种实现 AI 大型语言模型与商业智能结合的可能模式:
Text-to-API:在这种模式下,AI 大型语言模型通过解析用户的自然语言查询,将其转化为 API 请求,从而实现与后端数据库或服务的交互。这种模式的优势在于,它极大地简化了用户的操作流程,只需要输入自然语言查询,就能获取所需的数据或执行特定的操作。此外,Text-to-API 的模式还能够提升数据查询的效率和准确性,因为它直接通过 API 与后端数据库或服务进行交互,无需经过复杂的中间步骤。即根据基于用户输入的自然语言,系统进行意图识别,并相应地调用匹配的 API。
Text-to-Code 模式:在这个模式中,AI 大型语言模型将用户的自然语言查询转化为代码,实现对数据的高级查询和操作。这种模式的优势在于,它能够提供更灵活、更强大的数据处理能力,无需用户具备专业的编程技能,只需通过自然语言即可完成复杂的数据查询和操作。这极大地提升了数据处理的效率和用户体验。即根据用户的自然语言输入,利用 AI 大型语言模型对相关数据的理解,直接生成代码并执行分析。这可以被理解为 ChatGPT 中的代码解释器 Code Interpreter 的功能。
当然,以上提到的模式并非一一涵盖。例如,还有 Text-to-JSON 等其他方式在 AI 与商业智能结合的领域中也有广泛应用。
作为一名 AI 产品经理,选择 AI 大型语言模型与商业智能结合的最佳模式,需要根据您的特定需求、现有的技术基础以及期望的用户体验来进行全面考虑。每种模式,无论是 Text-to-API、Text-to-SQL 还是 Text-to-Code,都有其独特的应用场景和限制。因此,选择最适合的模式对于优化我们的对话式智能报表系统至关重要。
对 AI 大型语言模型和商业智能系统的观点:
Text-to-API 模式:在此模式中,AI 大型语言模型解析用户的自然语言查询,转化为 API 请求,实现与后端数据库或服务的交互。这种模式简化了用户操作流程,提升了数据查询的效率和准确性。其实现相对简单,能快速为已有的 BI 工具增添自然语言查询功能。但是,其灵活性和扩展性受限于底层 BI 工具的 API。因此,如果 API 功能较为有限,可能会影响 Text-to-API 模式的应用范围和深度。它适用于当企业已经部署了拥有丰富 API 支持的商业智能工具,并希望快速实现自然语言查询功能时。
交互式数据发现助手:对话式智能报表系统要求 AI 大型语言模型(LLM)具备更高的能力。这不仅包括深入理解用户的自然语言查询,实时处理数据,生成可视化效果,还包括在交互过程中不断调整和优化输出结果。因此,AI 大型语言模型不仅需要具备强大的自然语言理解(NLU)和自然语言生成(NLG)能力,还需要具备一定的逻辑推理和动态交互能力。
实时性和性能:在需要实时反馈的商业智能应用中,保证大型语言模型提供的方案能满足性能和即时性需求可能会遇到困难。这是因为在 AI 与商业智能结合的领域,我们的对话式智能报表系统可能会面临大型语言模型的计算资源和处理时间需求,尤其是在处理大规模数据集或复杂查询时。这可能会对系统的性能和实时反馈能力产生挑战。
在 AI 应用落地过程中,我们发现存在一个"效率 - 准确性 - 智能"的不可能三角挑战。如果希望快速且准确地解决问题,可能会在处理复杂问题时显得无能为力;如果需要精确地解决复杂问题,可能需要花费大量的时间进行思考、拆解和处理;如果希望能够迅速地解决复杂问题,可能会不可避免地产生"幻觉"。
SugarBI,作为百度智能云的一项主打服务,是一款敏捷的商业智能 (BI) 和数据可视化平台。它旨在解决数据 BI 分析以及报表和大屏的可视化问题。在 AI 与商业智能结合的应用中,我们成功地将 AI 技术融入到产品中,推出了「文心问数 Sugar Bot」功能,显著提升了用户的数据分析效率。
根据官方信息,百度 AI 技术驱动的 SugarBI 提供了包括自动分析、AI 问答以及波动分析在内的智能功能。以下是它的主要优势:
AI 问答:数据可视化 Sugar BI 集成了百度的自然语言处理(NLP)技术,能够准确理解用户的输入问题,并直接展示 Sugar BI 智能推荐的适合的可视化形式。根据您在控制面板中拖入的数据字段,系统将自动为您推荐相应的图表。这种数据可视化的方式,不仅提升了数据分析的效率,也大大提升了用户体验。
1. 获取用户的自然语言查询需求,如'各品牌的退款额分别是多少';
2. 将用户的查询需求转化为机器可理解的 SQL 语句,
例如 "SELECT `品牌名称`, SUM(`退款金额`) AS `退款额` FROM input1 GROUP BY `商品名称`"
返回生成的 SQL 查询语句给用户;
3. 进一步交互式的追问,例如'再加上渠道维度';
4. 再次将其转化为 SQL 语句,
例如 "SELECT `商品名称`, `渠道`, SUM(`退款金额`) AS `退款额` FROM input1 GROUP BY `商品名称`, `渠道`"
并返回给用户。
数据模型准备
在设置数据模型的页面上,您可以选择相应的数据表并建立关联:
在编辑页面,您可以将字段名称设置为易于理解的中文别名:
对于基础指标(度量),我们可以为其设置 AI 问答的同义词。这就像是为其建立一个'知识库',帮助大型语言模型理解专业术语,因为用户可能会有多种不同的提问方式。
我们也可以创建新的度量(指标加工),这是常规的 BI 功能:
要使用 AI 问答功能,需要先开启并等待模型训练完成(但我没有相关权限):
我们还可以设置 AI 问答的推荐问题,如果你在 ChatGPT 中自定义过自己的 GPTs,对此应该非常熟悉:
如果在大屏或报表编辑页面中关闭智能问数页面,Sugar BI 将会清空之前会话的所有内容。——这一限制可能是基于数据安全和隐私保护的考虑。自动清空会话内容可以防止敏感数据在系统中遗留,尤其是在多用户环境下。此外,这也有助于保持系统的高效运行,避免不必要的数据累积影响性能。
思考与延伸
在前面的学习内容中,我们主要关注了支持自然语言交互模式下的商业智能(BI)数据查询、分析和可视化呈现。实际上,在从问题定义、数据接入、处理、可视化展示、交互分析到决策行动的全过程中,AI 大型语言模型与商业智能(BI)的结合都能发挥重要作用。在整个 BI 数据分析链路中,AI 大型语言模型都有结合的可能性。
在前面的研究内容中,我们主要探讨了支持自然语言交互模式的商业智能(BI)数据查询、分析和可视化展示。实际上,在 BI 数据分析的全过程中,从问题定义、数据接入、处理、可视化展示、交互分析到决策行动,AI 大语言模型都有可能发挥重要作用。让我们从产品经理的角度,粗略地探讨一下:
问题定义:明确商业问题和目标。
问题:确定分析的焦点,如提升销售额、优化库存等。
AI 赋能:使用 AI 模型生成初步的数据分析和决策计划草案,再人工校对修改,以确保方向和目标的准确性。
数据接入:确定并接入数据源。
问题:如何高效处理和分析非结构化数据。
AI 驱动:利用 AI 技术直接处理非结构化数据,简化传统的数据清洗步骤,加速从数据到洞察的转化过程。
数据处理:进行数据的清洗、转换和加载(ETL)。
问题:简化 ETL 开发流程,提升数据处理效率。
AI 赋能:通过自然语言交互生成 ETL 任务和代码,辅助数据处理,实现多轮交互式构建,提高数据处理的灵活性和准确性。
数据可视化:将数据转化为易于理解的视觉形式。
问题:快速响应业务问题,提供直观的数据结果和结论。
AI 赋能:自动根据问题生成 SQL、JSON,利用 AI 生成文字结论、可视化图表和行动建议,实现问答式 BI。
交互分析:进行深度数据分析,生成深度分析报告。
问题:如何自动化生成深度分析报告,提供可信赖的业务分析。
AI 赋能:基于 BI 系统能力,结合企业内部数据源和 AI 生成的数据指标,自动识别异常原因并用自然语言展示,减少认知偏差(例如波动分析、异常分析和预警)。
本文详细阐述了 AI 大型语言模型在商业智能(BI)领域的多种应用模式,包括查询模式(Text-to-API, Text-to-SQL, Text-to-Code)和呈现模式(文本报告、可视化模板、交互助手)。通过分析网易有数、京东 ChatBI、百度 SugarBI 等头部企业的实践案例,我们看到了 AI 技术在降低数据使用门槛、提升分析效率方面的巨大潜力。
尽管目前仍面临幻觉、数据安全、实时性等挑战,但随着 RAG(检索增强生成)、Fine-tuning(微调)以及 Agent(智能体)技术的不断成熟,AI 与 BI 的融合将更加紧密。未来的 BI 产品将不仅仅是数据的展示工具,而是具备自主分析、预测和决策建议能力的智能助手。
对于企业和开发者而言,选择合适的技术路径(如 Text-to-SQL 或 Text-to-Code)并构建完善的知识库和权限管理体系,是实现 AI-BI 落地的关键。随着大模型成本的下降和性能的优化,我们有理由相信,对话式 BI 将成为企业数据战略的核心组成部分,推动数据民主化进程,让每一位业务人员都能成为数据分析师。