前言
数据分析是产品优化的催化剂。每行每业的业务发展都离不开数据的分析和洞察,基于数据进行决策。大模型技术的出现,衍生出了诸多优秀的'大模型 + 数据分析'的产品方案(GBI)。不论是企业还是个人开发者,从事数据分析相关工作的产品、技术、运营人员,都有必要了解行业里优秀的 GBI 产品是如何构建的,并学会使用这些能力为工作提效。
本文旨在辅助读者了解业内'大模型 + 数据分析'(GBI)的优秀产品逻辑,包括支撑的业务场景、产品功能、产品架构、产品实现链路等,并提供具体的测试案例,以辅助遇到类似产品/项目时如何设计系统方案。
1. AI 大厂及独角兽 GBI 产品调研
1.1 阿里云 - 析言 GBI 产品调研
产品概述: 析言 GBI 是基于阿里云通义大语言模型在数据分析领域专门增强的原生数据助理。通过自然语言交互实现 NL2SQL、数据问答、分析及洞察等多维度的大模型智能分析应用,适用于业务变化较快、数据分析时效性强的一线业务场景。
核心业务场景:
- 数据问答:直接回答基于数据的查询问题。
- 数据分析:对数据进行深度挖掘和可视化。
核心功能矩阵:
- Multi-Agent 引擎:包含底层的代码解释器、检索增强工具、数据查询工具,以及多轮 Chat、任务规划、选表、数据分析及可视化 Agent。
- 数据源管理:支持云上数据管理(DB Connector 组件)和非云数据管理(Adapter 组件),打通多种云数据库和本地数据。
高阶功能:
- 模型输出干预
- 数据集管理
- 算法定制(模型微调):针对模型不知道的业务问法或特殊算数公式,支持定制逻辑。
部署方案: 支持公有云和公有云&本地混合部署两种方案。
1.2 智谱清言 - 数据分析智能体调研
智谱清言提供了【数据分析】智能体。用户可通过分析上传文件或数据说明,帮助分析数据并提供图表化,也可通过简单的编码完成文件处理工作。
官方 API 介绍: 用户可调用 API 进行助手交互,支持文件上传与分析。
2. GBI 能力对比测试
为了直观体验不同产品的能力,我们选取了阿里析言、智谱清言数据分析智能体、通义千问 2.5 进行测试。
2.1 测试环境与配置
阿里析言流程:
- 关联并授权访问指定数据库。
- 配置数据表 Schema 信息。
- 配置业务知识。
测试用例: 使用官方预置数据库(消费者信息表 customers、订单信息表 orders、商品信息表 products)及自定义脱敏对话数据文件。
2.2 测试案例详解
(1)数据问答能力测试
- 案例:'显示在 2023-10 月之前加入的客户名单'。
- 结果:析言能够正确生成 SQL 并返回结果,展示了基础的 NL2SQL 能力。
(2)自定义数据分析能力测试
需求:找出数据中机器人回复效果不好的 case,给出原因和推荐回复;评估机器人回复质量;计算回复准确率。
阿里析言表现:
- 简单的统计类需求(如总行数)能完成。
- 复杂的智能分析需求(如评估回复质量)往往无法完成或中途停止,可能受限于复杂指令的理解或执行链路的稳定性。
智谱清言表现:
- 执行逻辑:


