基于知识库和 LLM 的问答系统实践与优化经验

基于知识库和 LLM 的问答系统实践与优化经验 | 极客日志

from langchain.document_loaders import DirectoryLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain.chains import RetrievalQA
from langchain.llms import HuggingFacePipeline

# 1. 加载文档
loader = DirectoryLoader('./data', glob="**/*.txt")
docs = loader.load()

# 2. 文本切分
splitter = RecursiveCharacterTextSplitter(
    chunk_size=512,
    chunk_overlap=50,
    length_function=len
)
chunks = splitter.split_documents(docs)

# 3. 初始化嵌入模型与向量库
embeddings = HuggingFaceEmbeddings(model_name="BAAI/bge-base-zh-v1.5")
vectorstore = Chroma.from_documents(documents=chunks, embedding=embeddings)

# 4. 初始化 LLM (此处以本地部署为例)
llm = HuggingFacePipeline.from_model_id(
    model_id="THUDM/chatglm3-6b",
    task="text-generation",
    pipeline_kwargs={"max_new_tokens": 512}
)

# 5. 构建检索问答链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=vectorstore.as_retriever(search_kwargs={"k": 5})
)

# 6. 执行问答
query = "什么是 RAG 技术？"
result = qa_chain({"query": query})
print(result["result"])

基于知识库和 LLM 的问答系统实践与优化经验

一、问答系统简介

二、基于 LLM 的问答系统架构

三、问题分析与解决方案

一）文本切分

二）向量模型

三）基座 LLM 选择

四）效果评价

四、工程化落地建议

五、代码实现示例

更多推荐文章

相关免费在线工具

基于知识库和 LLM 的问答系统实践与优化经验

一、问答系统简介

二、基于 LLM 的问答系统架构

三、问题分析与解决方案

一）文本切分

二）向量模型

三）基座 LLM 选择

四）效果评价

四、工程化落地建议

五、代码实现示例

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具