大模型 LLM 在 Text2SQL 中的应用实践 | 极客日志

PythonAI

大模型 LLM 在 Text2SQL 中的应用实践

大模型 LLM 在 Text2SQL 领域的应用实践。首先阐述了 Text2SQL 的基本概念，即将自然语言转换为 SQL 查询。接着详细讲解了 LangChain 框架的核心组件，包括 Models、Indexes、Chains 等。重点演示了如何利用 SQLDatabaseChain 连接 LLM 与 SQLite 数据库，实现了中文和英文提问自动转换为 SQL 并执行的功能。文章还指出了当前方案在幻觉、安全性和性能方面的潜在问题，并提出了相应的改进措施和最佳实践，旨在帮助开发者构建更稳定的 Text2SQL 应用系统。

灵魂伴侣发布于 2025/2/7更新于 2026/7/1735 浏览

大模型 LLM 在 Text2SQL 中的应用实践

一、前言

目前，大语言模型（LLM）的一个热门应用方向是 Text2SQL。它可以帮助用户快速生成想要查询的 SQL 语句，再结合可视化技术可以降低使用数据的门槛，更便捷地支持决策。本文将从以下四个方面介绍 LLM 在 Text2SQL 应用上的基础实践：

Text2SQL 概述
LangChain 基础知识
基于 SQLDatabaseChain 的 Text2SQL 实践
后续计划与最佳实践

二、Text2SQL 概述

Text-to-SQL（或 Text2SQL），顾名思义就是把文本转化为 SQL 语言。更学术一点的定义是：把数据库领域下的自然语言（Natural Language, NL）问题，转化为在关系型数据库中可以执行的结构化查询语言（Structured Query Language, SQL）。因此 Text-to-SQL 也可以被简写为 NL2SQL。

Text2SQL 输入输出示意图

输入：自然语言问题，例如'查询表 t_user 的相关信息，结果按 id 降序排序，只保留前 10 个数据'。
输出：SQL 语句，例如 SELECT * FROM t_user ORDER BY id DESC LIMIT 10。

Text2SQL 应用主要是帮助用户减少开发时间，降低开发成本。'打破人与结构化数据之间的壁垒'，即普通用户可以通过自然语言描述完成复杂数据库的查询工作，得到想要的结果。

Text2SQL 应用场景

基于 LLM 的应用开发基本架构如上图所示。本文介绍以 LangChain + OpenAI + RDB 的方式来实现 Text2SQL 的实践方案。

三、LangChain 基础知识

LangChain 是一个面向大语言模型的应用开发框架。如果将大语言模型比作人的大脑，那么可以将 LangChain 比作人的五官和四肢，它可以将外部数据源、工具和大语言模型连接在一起，既可以补充大语言模型的输入，也可以承接大语言模型的输出。

LangChain 提供各种不同的组件帮助使用 LLM，如下图所示，核心组件有 Models、Indexes、Chains、Memory、Prompt 以及 Agent。

LangChain 核心组件

3.1 Models

LangChain 本身不提供 LLM，提供通用的接口访问 LLM，可以很方便地更换底层的 LLM 以及自定义自己的 LLM。主要有两大类的 Models：

LLM：将文本字符串作为输入并返回文本字符串的模型，类似 OpenAI 的 text-davinci-003。
Chat Models：由语言模型支持将聊天消息列表作为输入并返回聊天消息的模型。一般使用的 ChatGPT 以及 Claude 为 Chat Models。

与模型交互可以通过给予 Prompt 的方式，LangChain 通过 PromptTemplate 的方式方便我们构建以及复用 Prompt。

代码示例如下：

 langchain  PromptTemplate


prompt = PromptTemplate(
    input_variables=[], 
    template=
)
(prompt.format_prompt(question=))

相关免费在线工具

RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online
Base64 文件转换器
将字符串、文件或图像转换为其 Base64 表示形式。在线工具，Base64 文件转换器在线工具，online

from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain import OpenAI
import os

os.environ["OPENAI_API_KEY"] = "Your openai key"

# 定义模型
llm = OpenAI(temperature=0)

# 定义提示模板
prompt = PromptTemplate(
    input_variables=["question"], 
    template="""简洁和专业的来回答用户的问题。
如果无法从中得到答案，请说'根据已知信息无法回答该问题'或'没有提供足够的相关信息'，不允许在答案中添加编造成分，答案请使用中文。
问题是：{question}"""
)

# 定义 chain
chain = LLMChain(llm=llm, prompt=prompt, verbose=True)

# 执行 chain
print(chain.run("如何开展数据治理"))

from langchain.llms import OpenAI
from langchain.utilities import SQLDatabase
from langchain_experimental.sql import SQLDatabaseChain
import os

os.environ["OPENAI_API_KEY"] = "Your openai key"

db = SQLDatabase.from_uri("sqlite:///..../Chinook.db")
llm = OpenAI(temperature=0, verbose=True)
db_chain = SQLDatabaseChain.from_llm(llm, db, verbose=True)
result = db_chain.run("总共有多少员工?")
print(result)

大模型 LLM 在 Text2SQL 中的应用实践

大模型 LLM 在 Text2SQL 中的应用实践

一、前言

二、Text2SQL 概述

三、LangChain 基础知识

3.1 Models

更多推荐文章

相关免费在线工具

3.2 Indexes

3.3 Chains

3.3.1 LLMChain

3.3.2 SQLDatabaseChain

3.3.3 SequentialChain

3.4 Memory

3.5 Agent

四、基于 SQLDatabaseChain 的 Text2SQL 实践

4.1 简介

4.2 数据准备

4.3 实践过程

（1）测试中文提问

（2）测试英文提问

五、后续计划与最佳实践

5.1 常见问题与解决方案

5.2 总结

更多推荐文章

相关免费在线工具

大模型 LLM 在 Text2SQL 中的应用实践

大模型 LLM 在 Text2SQL 中的应用实践

一、前言

二、Text2SQL 概述

三、LangChain 基础知识

3.1 Models

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3.2 Indexes

3.3 Chains

3.3.1 LLMChain

3.3.2 SQLDatabaseChain

3.3.3 SequentialChain

3.4 Memory

3.5 Agent

四、基于 SQLDatabaseChain 的 Text2SQL 实践

4.1 简介

4.2 数据准备

4.3 实践过程

（1）测试中文提问

（2）测试英文提问

五、后续计划与最佳实践

5.1 常见问题与解决方案

5.2 总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具