基于 DeepSeek V3.2 构建企业级 Text-to-SQL 专家系统 | 极客日志

PythonSaaSAI算法

基于 DeepSeek V3.2 构建企业级 Text-to-SQL 专家系统

综述由AI生成针对非技术人员查询数据困难的问题，利用 DeepSeek V3.2 大语言模型结合 Python 与 Streamlit 框架开发 Text-to-SQL 专家系统的完整流程。通过接入大模型 API、设计数据库 Schema 提示词工程、构建 Web 交互界面以及服务器自动化部署，实现了自然语言到 SQL 语句的精准转换。该系统降低了数据查询门槛，支持复杂业务逻辑分析，适用于企业级数据分析场景。

晚风告白发布于 2026/3/21更新于 2026/6/327 浏览

前言

在当前的数据驱动业务场景中，非技术背景的业务人员常常面临'查数难'的痛点。他们懂得业务逻辑，却无法编写复杂的 SQL 查询语句。为了解决这一矛盾，利用大语言模型（LLM）构建 Text-to-SQL（自然语言转 SQL）工具成为了极其高效的解决方案。DeepSeek V3.2 模型凭借其在数学逻辑、代码生成及结构化数据处理上的卓越表现，成为此类任务的理想选择。

本文将详细拆解如何利用大模型服务（MaaS）平台提供的 DeepSeek V3.2 API，结合 Python 与 Streamlit 框架，从零开发并部署一个智能 SQL 生成专家系统。

第一章：模型选型与 API 环境构建

1.1 DeepSeek V3.2 的技术优势

DeepSeek V3.2 在代码逻辑和推理能力上进行了专项微调。对于 Text-to-SQL 任务而言，模型不仅需要理解自然语言的语义，还需要精确理解数据库 Schema（表结构）、表之间的关联关系（外键、JOIN 逻辑）以及 SQL 的语法规范。该模型能够处理复杂的嵌套查询和聚合运算，不仅能生成 SQL，还能通过思维链（Chain of Thought）解释生成的逻辑，这对于排查错误和验证结果至关重要。

1.2 MaaS 平台接入

为了使用 DeepSeek V3.2，开发者需要接入大模型服务（MaaS）平台。该平台提供了稳定的 API 接口，兼容 OpenAI SDK，使得集成过程极为简便。

首先，访问模型管理平台控制台。

上图展示了 API Key 的创建界面。在控制台中，开发者需要创建一个新的 API Key。这个 Key 是身份验证的唯一凭证，必须妥善保管。点击创建后，系统会生成一串以 sk- 开头的字符，点击复制按钮将其保存。该凭证将在后续的 Python 代码中用于通过身份验证。

接下来，确认模型信息。

从上图的模型列表界面可以看到，我们需要调用的模型 ID 为 /maas/deepseek-ai/DeepSeek-V3.2。该界面清晰地列出了可用模型及其对应的 API 调用路径，确保开发者在代码配置中填写正确的 Model ID，以避免调用错误或版本不匹配的问题。同时，平台提供的 Base URL 为 https://api.example.com/v1（实际代码配置中通常使用 /v1 作为结尾，SDK 会自动补全后续路径）。

第二章：核心代码逻辑实现

2.1 Python 客户端集成

在获取 API Key 和模型 ID 后，需要编写 Python 代码与模型进行交互。这里使用标准的 openai 库，因为平台完全兼容 OpenAI 的接口规范。

from openai import OpenAI

# 构造 client
client = OpenAI(
    api_key="sk-xxxxxxxxxxx",  # 替换为实际申请的 APIKey
    base_url="https://api.example.com/v1",
)

# 流式 stream = True
stream = True

# 请求 chat_completion
chat_completion = client.chat.completions.create(
    model="/maas/deepseek-ai/DeepSeek-V3.2",
    messages=[{"role": , : }],
    stream=stream,
)

 stream:
     chunk  chat_completion:
        
         (chunk.choices[].delta, ):
            (, end=)
        
         (chunk.choices[].delta, ):
             chunk.choices[].delta.content     (chunk.choices[].delta.content) != :
                (chunk.choices[].delta.content, end=)
:
    result = chat_completion.choices[].message.content

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

pip install -r requirements.txt

streamlit run app.py

-- 1. 用户表：包含等级、注册时间和地域信息
CREATE TABLE users (
    user_id INT PRIMARY KEY COMMENT '用户唯一 ID',
    username VARCHAR(50),
    email VARCHAR(100),
    vip_level INT DEFAULT 0 COMMENT 'VIP 等级：0=普通，1=白银，2=黄金，3=钻石',
    balance DECIMAL(10,2) COMMENT '账户余额',
    created_at DATETIME COMMENT '注册时间',
    region VARCHAR(50) COMMENT '用户所在地区，如：Beijing, Shanghai'
);

-- 2. 产品表：包含价格、成本、库存和分类
CREATE TABLE products (
    product_id INT PRIMARY KEY,
    product_name VARCHAR(100),
    category_name VARCHAR(50) COMMENT '产品分类，如：电子产品，家居，服装',
    price DECIMAL(10,2) COMMENT '当前售价',
    cost DECIMAL(10,2) COMMENT '进货成本',
    stock_quantity INT COMMENT '剩余库存数量',
    status VARCHAR(20) COMMENT '状态：on_shelf(上架), off_shelf(下架)'
);

-- 3. 订单主表：记录谁买的、什么时候买的、总金额
CREATE TABLE orders (
    order_id INT PRIMARY KEY,
    user_id INT COMMENT '关联 users 表',
    total_amount DECIMAL(10,2) COMMENT '订单实付总金额',
    order_date DATETIME COMMENT '下单时间',
    status VARCHAR(20) COMMENT '订单状态：pending(待支付), paid(已支付), cancelled(已取消), refunded(已退款)',
    payment_method VARCHAR(20) COMMENT '支付方式：alipay, wechat, credit_card'
);

-- 4. 订单详情表：记录具体买了哪些商品（用于分析销量和爆款）
CREATE TABLE order_items (
    item_id INT PRIMARY KEY,
    order_id INT COMMENT '关联 orders 表',
    product_id INT COMMENT '关联 products 表',
    quantity INT COMMENT '购买数量',
    unit_price DECIMAL(10,2) COMMENT '购买时的单价（可能与当前产品价格不同）'
);

#!/bin/bash
# MySQL_Agent Streamlit 应用部署脚本
set -e
echo "=== 1. 安装系统依赖 ==="
sudo apt update
sudo apt install -y nginx python3-pip python3-venv

echo "=== 2. 创建虚拟环境并安装依赖 ==="
cd ~/MySQL_Agent
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

echo "=== 3. 创建 systemd 服务 ==="
sudo tee /etc/systemd/system/mysql-agent.service > /dev/null <<'EOF'
[Unit]
Description=MySQL Agent Streamlit App
After=network.target

[Service]
Type=simple
User=root
WorkingDirectory=/root/MySQL_Agent
Environment="PATH=/root/MySQL_Agent/venv/bin"
ExecStart=/root/MySQL_Agent/venv/bin/streamlit run app.py --server.port 8501 --server.address 127.0.0.1 --server.headless true
Restart=always
RestartSec=3

[Install]
WantedBy=multi-user.target
EOF
# 路径已硬编码为 root 用户
echo "=== 4. 配置 Nginx 反向代理 ==="
sudo tee /etc/nginx/sites-available/mysql-agent > /dev/null <<'EOF'
server {
    listen 80;
    server_name _;
    location / {
        proxy_pass http://127.0.0.1:8501;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
        proxy_read_timeout 86400;
    }
    location /_stcore/stream {
        proxy_pass http://127.0.0.1:8501/_stcore/stream;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_set_header Host $host;
        proxy_read_timeout 86400;
    }
}
EOF
echo "=== 5. 启用站点配置 ==="
sudo ln -sf /etc/nginx/sites-available/mysql-agent /etc/nginx/sites-enabled/
sudo rm -f /etc/nginx/sites-enabled/default

echo "=== 6. 启动服务 ==="
sudo systemctl daemon-reload
sudo systemctl enable mysql-agent
sudo systemctl start mysql-agent
sudo systemctl restart nginx

echo "=== 部署完成! ==="
echo "访问地址：http://$(hostname -I | awk '{print $1}')"

cd ~/MySQL_Agent && ./deploy.sh

streamlit run app.py --server.port 8501 --server.address 0.0.0.0 --server.headless true

""" 智能 SQL 生成与优化专家 - Web 界面 """
import streamlit as st
from sql_agent import SQLAgent

st.set_page_config(page_title="SQL 智能助手", page_icon="🔍", layout="wide")
st.title("🔍 智能 SQL 生成与优化专家")
st.caption("将自然语言转换为精准的 SQL 查询")

# 初始化 Agent
if "agent" not in st.session_state:
    st.session_state.agent = SQLAgent()

if "messages" not in st.session_state:
    st.session_state.messages = []

# 侧边栏 - Schema 输入
with st.sidebar:
    st.header("📋 数据库 Schema")
    # 示例 Schema
    example_schema = """-- 用户表
CREATE TABLE users (
    user_id INT PRIMARY KEY,
    username VARCHAR(50),
    email VARCHAR(100),
    created_at DATETIME,
    vip_level INT DEFAULT 0
);
-- 产品表
CREATE TABLE products (
    product_id INT PRIMARY KEY,
    product_name VARCHAR(100),
    category VARCHAR(50),
    price DECIMAL(10,2),
    stock INT
);
-- 订单表
CREATE TABLE orders (
    order_id INT PRIMARY KEY,
    user_id INT,
    order_date DATETIME,
    total_amount DECIMAL(10,2),
    status VARCHAR(20)
);
-- 订单明细表
CREATE TABLE order_items (
    item_id INT PRIMARY KEY,
    order_id INT,
    product_id INT,
    quantity INT,
    unit_price DECIMAL(10,2)
);"""
    schema = st.text_area("请输入表结构（DDL）：", value=example_schema, height=400)
    if st.button("✅ 确认 Schema", use_container_width=True):
        st.session_state.agent.set_schema(schema)
        st.session_state.messages = []
        st.success("Schema 已更新！")
    st.divider()
    st.markdown("### 💡 示例问题")
    examples = [
        "查询上季度复购率最高的前十个产品",
        "统计每个月的销售额趋势",
        "找出消费金额最高的 VIP 用户",
        "哪些产品库存不足 10 件？"
    ]
    for ex in examples:
        st.markdown(f"- {ex}")

# 主界面 - 对话
for msg in st.session_state.messages:
    with st.chat_message(msg["role"]):
        st.markdown(msg["content"])

# 用户输入
if prompt := st.chat_input("请输入您的数据查询需求..."):
    # 显示用户消息
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(prompt)

    # 生成 SQL
    with st.chat_message("assistant"):
        placeholder = st.empty()
        full_response = ""
        for chunk in st.session_state.agent.generate_sql(prompt):
            full_response += chunk
            placeholder.markdown(full_response + "▌")
        placeholder.markdown(full_response)
        st.session_state.messages.append({"role": "assistant", "content": full_response})

# DeepSeek API 配置
API_KEY = "sk-xxxxxxxxxxxxxxx"
BASE_URL = "https://api.example.com/v1"
MODEL_ID = "/maas/deepseek-ai/DeepSeek-V3.2"

基于 DeepSeek V3.2 构建企业级 Text-to-SQL 专家系统

前言

第一章：模型选型与 API 环境构建

1.1 DeepSeek V3.2 的技术优势

1.2 MaaS 平台接入

第二章：核心代码逻辑实现

2.1 Python 客户端集成

更多推荐文章

相关免费在线工具

2.2 项目结构初始化

第三章：Streamlit 可视化界面开发

第四章：Schema 定义与 SQL 生成实测

4.1 全能型电商 Schema 设计

4.2 场景化测试

第五章：生产环境服务器部署

5.1 远程连接与代码传输

5.2 自动化部署脚本

5.3 端口配置与访问优化

相关代码如下：

app.py

config.py

结语

更多推荐文章

相关免费在线工具

基于 DeepSeek V3.2 构建企业级 Text-to-SQL 专家系统

前言

第一章：模型选型与 API 环境构建

1.1 DeepSeek V3.2 的技术优势

1.2 MaaS 平台接入

第二章：核心代码逻辑实现

2.1 Python 客户端集成

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.2 项目结构初始化

第三章：Streamlit 可视化界面开发

第四章：Schema 定义与 SQL 生成实测

4.1 全能型电商 Schema 设计

4.2 场景化测试

第五章：生产环境服务器部署

5.1 远程连接与代码传输

5.2 自动化部署脚本

5.3 端口配置与访问优化

相关代码如下：

app.py

config.py

结语

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具