QAnything 本地知识库问答系统：支持海量数据与跨语种 RAG 应用

QAnything 是一款支持任意格式文件的本地知识库问答系统，基于检索增强生成（RAG）技术。它采用两阶段检索机制（Embedding + Rerank），利用 BCEmbedding 模型实现强大的双语和跨语种语义表征能力，解决大规模数据检索退化问题。系统支持 PDF、Word、PPT 等多种文件格式，可断网部署，保障数据安全。文章介绍了其架构优势、核心模型评测、LLM 集成方式、快速安装步骤及常见问题解决方案。

CryptoLab发布于 2025/2/6更新于 2026/7/2336 浏览

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用。

您的任何格式的本地文件都可以往里扔，即可获得准确、快速、靠谱的问答体验。

目前已支持格式：PDF，Word(doc/docx)，PPT，Markdown，Eml，TXT，图片（jpg，png 等），网页链接，更多格式，敬请期待…

特点

数据安全，支持全程拔网线安装使用。
支持跨语种问答，中英文问答随意切换，无所谓文件是什么语种。
支持海量数据问答，两阶段向量排序，解决了大规模数据检索退化的问题，数据越多，效果越好。
高性能生产级系统，可直接部署企业应用。
易用性，无需繁琐的配置，一键安装部署，拿来就用。
支持选择多知识库问答。

架构

QAnything System Architecture

1. 两阶段检索优势

知识库数据量大的场景下两阶段优势非常明显，如果只用一阶段 embedding 检索，随着数据量增大会出现检索退化的问题，如下图中绿线所示，二阶段 rerank 重排后能实现准确率稳定增长，即数据越多，效果越好。

Two Stage Retrieval Performance

BCEmbedding 是由网易有道开发的中英双语和跨语种语义表征算法模型库，其中包含 EmbeddingModel 和 RerankerModel 两类基础模型。EmbeddingModel 专门用于生成语义向量，在语义搜索和问答中起着关键作用，而 RerankerModel 擅长优化语义搜索结果和语义相关顺序精排。

BCEmbedding 作为有道的检索增强生成式应用（RAG）的基石，特别是在 QAnything 中发挥着重要作用。QAnything 作为一个开源项目，在有道许多产品中有很好的应用实践，比如有道速读和有道翻译。

QAnything 使用的检索组件有非常强悍的双语和跨语种能力，能消除语义检索里面的中英语言之间的差异，从而实现强大的双语和跨语种语义表征能力。

基于 LlamaIndex 的 RAG 评测，表现 SOTA。

双语和跨语种优势

现有的单个语义表征模型在双语和跨语种场景中常常表现不佳，特别是在中文、英文及其跨语种任务中。BCEmbedding 充分利用有道翻译引擎的优势，实现只需一个模型就可以在单语、双语和跨语种场景中表现出卓越的性能。

EmbeddingModel 支持中文和英文（之后会支持更多语种）；RerankerModel 支持中文，英文，日文和韩文。

1.1 一阶段检索（embedding）

模型名称

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

QAnything (Question and Answer based on Anything) 是致力于支持任意格式文件或数据库的本地知识库问答系统，可断网安装使用。

您的任何格式的本地文件都可以往里扔，即可获得准确、快速、靠谱的问答体验。

目前已支持格式：PDF，Word(doc/docx)，PPT，Markdown，Eml，TXT，图片（jpg，png 等），网页链接，更多格式，敬请期待…

特点

数据安全，支持全程拔网线安装使用。
支持跨语种问答，中英文问答随意切换，无所谓文件是什么语种。
支持海量数据问答，两阶段向量排序，解决了大规模数据检索退化的问题，数据越多，效果越好。
高性能生产级系统，可直接部署企业应用。
易用性，无需繁琐的配置，一键安装部署，拿来就用。
支持选择多知识库问答。

架构

QAnything System Architecture

1. 两阶段检索优势

Two Stage Retrieval Performance

QAnything 使用的检索组件有非常强悍的双语和跨语种能力，能消除语义检索里面的中英语言之间的差异，从而实现强大的双语和跨语种语义表征能力。

基于 LlamaIndex 的 RAG 评测，表现 SOTA。

双语和跨语种优势

EmbeddingModel 支持中文和英文（之后会支持更多语种）；RerankerModel 支持中文，英文，日文和韩文。

1.1 一阶段检索（embedding）

模型名称

bge-base-en-v1.5	37.14	55.06	75.45	59.73	43.05	37.74	47.20
bge-base-zh-v1.5	47.60	63.72	77.40	63.38	54.85	32.56	53.60
bge-large-en-v1.5	37.15	54.09	75.00	59.24	42.68	37.32	46.82
bge-large-zh-v1.5	47.54	64.73	79.14	64.19	55.88	33.26	54.21
jina-embeddings-v2-base-en	31.58	54.28	74.84	58.42	41.16	34.67	44.29
m3e-base	46.29	63.93	71.84	64.08	52.38	37.84	53.54
m3e-large	34.85	59.74	67.69	60.07	48.99	31.62	46.78
bce-embedding-base_v1	57.60	65.73	74.96	69.00	57.29	38.95	59.43

模型名称	Reranking	平均
bge-reranker-base	57.78	57.78
bge-reranker-large	59.69	59.69
bce-reranker-base_v1	60.06	60.06

Model	AskUbuntuDupQuestions	MindSmallReranking	SciDocsRR	StackOverflowDupQuestions	AVG
bge-reranker-base	54.70	28.48	67.09	37.55	46.96
bge-reranker-large	58.73	28.84	71.30	39.04	49.48
bce-reranker-base_v1	56.54	30.73	75.79	42.88	51.48

Model	Reranking	AVG
bge-reranker-base	46.96	46.96
bge-reranker-large	49.48	49.48
bce-reranker-base_v1	51.48	51.48

Model	T2Reranking	MMarcoReranking	CMedQAv1	CMedQAv2	AVG
bge-reranker-base	67.28	35.46	81.27	84.10	67.03
bge-reranker-large	67.60	37.64	82.14	84.18	67.89
bce-reranker-base_v1	70.25	34.13	79.64	81.31	66.33

QAnything 本地知识库问答系统：支持海量数据与跨语种 RAG 应用

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

特点

架构

1. 两阶段检索优势

双语和跨语种优势

1.1 一阶段检索（embedding）

QAnything 本地知识库问答系统：支持海量数据与跨语种 RAG 应用

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

特点

架构

1. 两阶段检索优势

双语和跨语种优势

1.1 一阶段检索（embedding）

更多推荐文章

相关免费在线工具

1.2 二阶段检索（rerank）

评测结果详情

1.3 基于 LlamaIndex 的 RAG 评测（embedding and rerank）

2. LLM

2.1 快速开始

必要条件

下载安装

开始体验

3. Demo 展示

信息抽取

网页问答

文件大杂烩

4. 常见问题

更多推荐文章

相关免费在线工具

Model	T2RerankingEn2Zh	MMarcoRerankingEn2Zh	AVG
bge-reranker-base	60.45	64.41	62.43
bge-reranker-large	61.64	67.17	64.41
bce-reranker-base_v1	63.63	67.92	65.78

Model	T2RerankingZh2En	MMarcoRerankingZh2En	AVG
bge-reranker-base	63.94	63.79	63.87
bge-reranker-large	64.13	67.89	66.01
bce-reranker-base_v1	65.38	67.23	66.31

Model	Reranking (12)	AVG (12)
bge-reranker-base	59.04	59.04
bge-reranker-large	60.86	60.86
bce-reranker-base_v1	61.29	61.29

System	Required item	Minimum Requirement	Note
Linux	Single NVIDIA GPU Memory	>= 16GB	NVIDIA 3090 x 1 recommended
Linux	Double NVIDIA GPU Memory	>= 11GB + 5G	NVIDIA 2080TI × 2 recommended
Linux	NVIDIA Driver Version	>= 525.105.17
Linux	CUDA Version	>= 12.0
Linux	Docker version	>= 20.10.5
Linux	docker compose version	>= 2.23.3

System	Required item	Minimum Requirement	Note
Windows 11 with WSL 2	Single NVIDIA GPU Memory	>= 16GB	NVIDIA 3090
Windows 11 with WSL 2	Double NVIDIA GPU Memory	>= 11GB + 5G	NVIDIA 2080TI × 2
Windows 11 with WSL 2	GEFORCE EXPERIENCE	>= 546.33
Windows 11 with WSL 2	Docker Desktop	>= 4.26.1（131620）

QAnything 本地知识库问答系统：支持海量数据与跨语种 RAG 应用

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

特点

架构

1. 两阶段检索优势

双语和跨语种优势

1.1 一阶段检索（embedding）

QAnything 本地知识库问答系统：支持海量数据与跨语种 RAG 应用

QAnything 本地知识库问答系统：基于检索增强生成式应用（RAG）

特点

架构

1. 两阶段检索优势

双语和跨语种优势

1.1 一阶段检索（embedding）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 二阶段检索（rerank）

评测结果详情

1.3 基于 LlamaIndex 的 RAG 评测（embedding and rerank）

2. LLM

2.1 快速开始

必要条件

下载安装

开始体验

3. Demo 展示

信息抽取

网页问答

文件大杂烩

4. 常见问题

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具