基于 RAGFlow 搭建 AI 医疗问诊助手
一、RAGFlow 简介
RAGFlow 是一款基于深度文档理解构建的开源检索增强生成(Retrieval-Augmented Generation, RAG)引擎。它能够为各种规模的企业及个人提供一套精简的 RAG 工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
RAGFlow 的核心作用在于让用户创建自有知识库,根据设定的参数对知识库中的文件进行智能切块处理。当用户向大模型提问时,RAGFlow 先查找自有知识库中的切块内容,接着把查找到的知识库数据输入到对话大模型中再生成答案输出。相比传统的微调模型,RAGFlow 在医疗领域问答中对幻觉控制得更好,且无需昂贵的训练成本即可实现高质量回答。
主要特性
- 深度文档理解:支持多种复杂格式数据的解析。
- Graph RAG:支持基于图的工作流,允许创建超越传统 DAG 的复杂流程。
- 多模态支持:支持音频文件解析、从 Markdown 提取表格、从 Docx 提取图像等。
- 自我优化:支持 Self-RAG,提升自我纠错和优化能力。
二、环境准备与安装
1. 硬件与软件要求
- CPU:至少四核
- 内存:大于 16GB
- 磁盘存储:大于 50GB
- Docker:确保已安装 Docker Desktop
- WSL2:Windows Subsystem for Linux 版本 2
2. 配置 WSL2
在 Windows 系统中启用虚拟化功能并升级至 WSL2。
- 打开控制面板 -> 程序和功能 -> 启用或关闭 Windows 功能,勾选'适用于 Linux 的 Windows 子系统'和'虚拟机平台'。
- 以管理员身份打开 PowerShell 或 CMD,执行以下命令更新并安装 Ubuntu 22.04:
wsl --update
wsl --install -d Ubuntu-22.04
wsl --set-default-version 2
- 启动 Linux 环境并设置时区:
wsl -d Ubuntu-22.04
timedatectl set-timezone Asia/Shanghai
3. 部署 RAGFlow
使用 Git Bash 或 WSL 终端执行以下步骤:
- 克隆仓库:
git clone https://github.com/infiniflow/ragflow.git
cd ragflow/docker
- 配置环境变量:
修改
./docker/.env文件第 45 行,将 HF_ENDPOINT 设置为国内镜像站点以加速下载:
HF_ENDPOINT=https://hf-mirror.com
- 启动服务:
chmod +x ./entrypoint.sh
docker compose -f docker-compose.yml up -d
- :


