DB-GPT 基于阿里云 GPU 实例的本地化部署指南

简介

DB-GPT 是一个实验性的开源应用，它基于 FastChat，并使用 vicuna-13b 作为基础模型。模型与数据全部本地化部署，绝对保障数据的隐私安全。同时此 GPT 项目可以直接本地部署连接到私有数据库，进行私有数据处理，目前已支持 SQL 生成、SQL 诊断、数据库知识问答、数据处理等一系列的工作。

背景

DB-GPT 从发布第一个可运行版本以来，引起了广泛关注。由于 DB-GPT 使用 Vicuna-13B 的模型作为 Base Model，在消费级 GPU 上即可完成部署，但配置过程较为复杂。具体部署的硬件说明如下：

GPU 型号	显存大小	性能
RTX4090	24G	可以流畅的进行对话推理，无卡顿
RTX3090	24G	可以流畅进行对话推理，有轻微卡顿感，优于 V100
V100	16G	可以进行对话推理，有明显卡顿

本文旨在提供一套完整的阿里云部署教程，帮助用户快速搭建测试环境。请注意，因项目主要处于实验性质，不建议直接用于生产环境。

环境准备

创建阿里云 GPU 实例

账号准备：确保拥有阿里云账号并完成实名认证。建议充值一定金额以购买按量付费资源。
实例选购：进入 ECS 控制台，选择 GPU 云服务器产品。建议选择按量付费模式，根据推理性能需求选择显卡型号（如 T4, V100, A10 等）。
配置选项：
- 系统盘：建议不小于 200G SSD，避免模型文件下载后空间不足。
- 释放策略：取消勾选'随实例释放'，以便后续仅释放实例而保留数据盘中的模型文件。若需长期使用，建议创建快照备份。
- 网络带宽：建议选择大一点带宽（如 25M），并选择按流量付费，同时购买流量包以防突发流量产生高额费用。
- 安全组：初始配置无需特殊设置，后续可在管理控制台开放特定端口。
- 自动释放：务必设置自动释放时间，防止忘记释放导致持续扣费。

GPU 实例配置界面

登录实例安装环境依赖

登录实例后，首先确认 GPU 驱动已正确安装。随后安装必要的系统依赖包：

yum -y install git 
yum install git-lfs
yum install g++
yum install docker

安装完成后，验证 Docker 是否正常运行：

docker --version

部署服务

部署流程主要分为三步：模型准备、依赖服务启动、DB-GPT 服务启动。

模型准备

我们需要下载两个基础模型：以及。由于 HuggingFace 访问可能受限，建议使用国内镜像源或代理。

DB-GPT 基于阿里云 GPU 实例的本地化部署指南

DB-GPT 基于阿里云 GPU 实例的本地化部署指南

简介

背景

环境准备

创建阿里云 GPU 实例

登录实例安装环境依赖

部署服务

模型准备

更多推荐文章

相关免费在线工具

依赖服务启动

DB-GPT 服务启动

1. 安装环境与依赖

2. 配置环境变量

3. 启动服务端

4. 启动客户端

配置安全策略

常见问题排查

演示与验证

小结

更多推荐文章

相关免费在线工具

DB-GPT 基于阿里云 GPU 实例的本地化部署指南

DB-GPT 基于阿里云 GPU 实例的本地化部署指南

简介

背景

环境准备

创建阿里云 GPU 实例

登录实例安装环境依赖

部署服务

模型准备

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

依赖服务启动

DB-GPT 服务启动

1. 安装环境与依赖

2. 配置环境变量

3. 启动服务端

4. 启动客户端

配置安全策略

常见问题排查

演示与验证

小结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具