开源公告|Youtu-RAG:新一代智能体驱动的检索增强生成系统
你可能已经搭建过这样的 RAG 流程:离线切块入库 → 向量检索 → 拼接上下文 → LLM 生成。它能跑起来,但在真实场景下,困难接踵而至:
● 文档类型多(PDF / 图片 / Excel / 数据库),处理链路各不相同
● 问题类型杂(闲聊 / 查资料 / 查表 / 查库),单一检索策略难以兼顾
● 效果波动调试难,阈值、topN 等参数调整依赖具体场景和经验
● 由于数据合规与隐私问题,本地化部署成为硬性需求
核心亮点:
Youtu-RAG 致力于让系统自主思考和处理检索增强生成流程。我们将 RAG 从“提问-匹配-回答”的固定流程,升级为由智能体统筹的主动决策系统:
● 本地部署:从模型到数据,可选择全程运行在您的本地环境内,满足数据不出域的需求
● 自主决策:Agentic-RAG 框架,智能体自主判断是否检索、如何检索、何时调用记忆等,实现查询与策略的动态匹配
● 记忆驱动:结合短期会话记忆与长期知识沉淀,让每一次交互都成为系统成长的养分,持续优化后续响应
它解决什么问题?
如果你想要的是一个“能管理文件、能做知识库、能做表格与数据库问答、还能持续变聪明”的本地 RAG 系统,Youtu-RAG 给的是一套工程化、可扩展、可评测的“答案”。

技术栈生态:
Youtu-RAG 的智能体编排能力基于 Youtu-Agent 框架构建,可兼容各种模型(如 DeepSeek 、K2.5 等)、工具和框架。同时也通过无缝对接优图自研的开源生态能力,最大化的提升系统端到端的效果:
● Youtu-Embedding:向量编码/语义检索底座
● Youtu-Parsing:文档解析与 OCR 相关能力(用于 PDF / 图片等非纯文本场景)
● Youtu-HiChunk:更智能的长文档分块 / 层次化处理能力

技术速览:
1.数据进入系统(File-based Management)
● 多源文件上传/管理:PDF、Word、Markdown、Excel、图片、数据库等
● 统一的文件资产与元信息管理:摘要、Metadata、预览内容等
● 本地对象存储:集成 MinIO 以支持大规模文件的本地化管理

2.知识组织与构建(Knowledge Base)
● 多源数据关联:文件/数据库/示例 QA 的统一关联
● 多源数据的向量化构建与检索准备:Embedding 索引、可选重排器(Reranker)
● 示例 QA 学习:执行 pre-action 为相似问题提供可靠经验

3.对话与任务执行(Agentic Runtime)
● 多 Agent 编排:通用对话、KB 检索、文件 QA、Excel 分析、Text2SQL 等
● 自主路由与策略选择:同一个问题,不一定走同一种检索方式
● 记忆机制介入:把“这类问题怎么做更好”沉淀下来


👉 文件系统展示:
👉对话系统展示:
适用人群与场景
● 想做本地知识库/内网问答的个人与团队:数据不出域,文件管理与知识库能力完整
● 有结构化数据需求的工程团队:Text2SQL 智能体 让“查库”更接近可验证的工作流
● 经常分析报表的人:Excel 智能体通过“问题拆解 + 数据分析 + 结论呈现”的方式实现表格深度分析
● 希望 RAG 变得可控、可复用、可持续迭代的研发团队:智能体决策 + 记忆机制,能把经验沉淀下来
关于 Youtu-RAG
Youtu-RAG 将持续关注实际业务落地中的挑战,通过改善智能决策与记忆演进机制推动下一代框架的研发。项目现已完全开源,欢迎下载使用,同时诚邀您通过提交 Issue、PR 或分享实践案例,与我们共同打造更智能、更高效的下一代 RAG 系统。
📚 官方文档:
https://youtu-rag-docs.vercel.app
👉 Github 仓库:
https://github.com/TencentCloudADP/youtu-rag
🔎 欢迎扫码了解更多详情:

关注腾讯开源公众号
获取更多最新腾讯官方开源信息!