RAG 实战：基于 Gradio 构建本地文件上传与对话 UI 界面

前言

在上一节中，我们实现了 RAG（检索增强生成）的基本流程，包括文档解析、向量化存储和检索。本节将在此基础上增加一个 Web 用户界面（UI），利用浏览器打开，实现上传本地文件、解析文档，并利用大模型实现与该文档的对话。这实际上是一个简化版的 ChatPDF 或企业知识库对话系统。

技术选型

界面采用 Python 的 Gradio 库。该库在机器学习和大模型领域非常流行，运行后会启动一个本地 Web 服务器，并在默认浏览器中打开一个新页面，显示交互界面。其优势在于开发效率极高，适合快速原型验证。

环境准备

在开始之前，请确保已安装以下依赖：

Python 3.8+
Gradio 库
前文实现的 RAG 核心模块（如 rag.py）

安装 Gradio 命令如下（建议使用国内镜像源以提高速度）：

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple gradio

第一步：创建基础文件上传界面

首先，我们需要一个能够接收用户上传文件的界面。即使不熟悉 Gradio，也可以通过简单的几行代码实现。

基本代码如下：

import gradio as gr

def upload_file(input_file):
    # input_file 是上传的文件对象
    return f"你上传的文件内容是：\n{input_file}"

gr.Interface(
    fn=upload_file,
    inputs="file",
    outputs="text",
    title="文件上传器",
    description="请点击按钮上传文件。",
    allow_flagging=False
).launch()

运行后，点击界面上的'选择文件'按钮，选择本地文件并提交，右侧输出框会显示文件路径信息。

第二步：集成 RAG 后端逻辑

接下来，我们将上传的文件处理逻辑与 RAG 系统结合。当用户上传图片时，我们需要调用 RAG 类的接口来创建向量数据库。

假设我们已经有一个封装好的 RAG_Bot 类，它包含 createVectorDB 方法用于初始化向量库，以及 chat 方法用于问答。

修改后的处理函数如下：

from rag import RAG_Bot

chat_bot = RAG_Bot()

def upload_file(input_file):
    if input_file:
        # 创建向量库，灌入数据
        chat_bot.createVectorDB(input_file)

RAG 实战：基于 Gradio 构建本地文件上传与对话 UI 界面