RAG 技术详解：解决大模型痛点与低成本 AI 升级方案 | 极客日志

PythonAI算法

RAG 技术详解：解决大模型痛点与低成本 AI 升级方案

深入解析大语言模型（LLM）面临的幻觉、时效性及数据安全问题。介绍检索增强生成（RAG）技术的定义、架构及八大优势，如可扩展性、准确性与安全性。对比 RAG 与 SFT 在数据处理、定制等方面的差异，详述数据索引、检索与文本生成的典型实现方法。列举 ChatPDF、Baichuan 等案例，分析当前存在的问题如检索依赖性与效率瓶颈，并提出多模态、实时及个性化拓展方案。旨在帮助开发者理解 RAG 如何以低成本实现 AI 能力升级。

神经兮兮发布于 2026/4/6更新于 2026/7/2350 浏览

大模型 RAG 技术深度解析：从入门到进阶

在这里插入图片描述

一、大语言模型（LLM）的三大痛点

大语言模型痛点

1.1 幻觉问题：一本正经地胡说八道

专业解释：LLM 的文本生成是基于概率的 token by token 形式，它会根据训练数据中的模式生成最可能的下一个 token，但并不理解语义的正确性。

大白话解读：就像一个学生考试时遇到不会的题目，凭借记忆中的片段瞎蒙答案，虽然看起来像模像样，但实际上可能完全错误。

生活案例：当你问 AI：'太阳为什么从西边升起？'，它可能会一本正经地解释:'因为地球自转方向发生了改变'，而实际上太阳根本不会从西边升起。

示例 Python 代码：

from transformers import pipeline 
generator = pipeline('text-generation', model='gpt2') 
result = generator("太阳为什么从西边升起？", max_length=100, num_return_sequences=1) 
print(result[0]['generated_text'])

1.2 时效性问题：知识更新不及时

专业解释：大型语言模型的训练成本极高，周期长，导致实时性强的数据无法及时参与训练，模型无法回答时效性相关的问题。

大白话解读：就像一个只会背诵五年前课本知识的学生，无法回答最新的科技进展或热点事件。

生活案例：当你在 2026 年问 AI：'2026 年的春节是哪一天？'，如果 AI 的训练数据截止到 2023 年，它可能无法给出正确答案。

示例 Python 代码：

from datetime import datetime 
import requests 

def get_current_time():
    return datetime.now().strftime("%Y-%m-%d %H:%M:%S") 

def (): 
    response = requests.get() 
     response.json() 

() 
()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

from langchain.llms import OpenAI 
from langchain.prompts import PromptTemplate 
from langchain.chains import LLMChain 

# 本地处理敏感数据
def process_sensitive_data(data):
    # 脱敏处理
    return data.replace("敏感信息", "***") 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建 Prompt 模板 
prompt = PromptTemplate(
    input_variables=["data"], 
    template="分析以下数据：{data}"
) 

# 创建 LLM Chain 
chain = LLMChain(llm=llm, prompt=prompt) 

# 处理敏感数据 
sensitive_data = "用户的敏感信息：1234567890" 
processed_data = process_sensitive_data(sensitive_data) 

# 调用 LLM 进行分析 
result = chain.run(processed_data) 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings) 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 

# 提问 
result = qa_chain.run("如何做红烧肉？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings() 

# 创建向量数据库 
documents = ["Python 学习资源 1...","Python 学习资源 2...","Python 学习资源 3..."] 
db = FAISS.from_texts(documents, embeddings) 

# 检索相关文档 
query = "如何学习 Python" 
docs = db.similarity_search(query, k=2) 
for doc in docs:
    print(doc.page_content)

from langchain.llms import OpenAI 
from langchain.prompts import PromptTemplate 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建 Prompt 模板 
prompt = PromptTemplate( 
    input_variables=["context","question"], 
    template="基于以下上下文回答问题：\n{context}\n\n问题：{question}"
) 

# 检索到的上下文 
context = "Python 是一种高级编程语言，易于学习和使用。" 

# 提问 
question = "Python 是什么？" 

# 生成回答 
result = llm(prompt.format(context=context, question=question)) 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings()
# 加载企业内部知识库 
db = FAISS.load_local("enterprise_knowledge_base", embeddings) 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 

# 提问 
result = qa_chain.run("公司的请假政策是什么？") 
print(result)

from langchain.llms import OpenAI 
from langchain.prompts import PromptTemplate 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建 Prompt 模板 
prompt = PromptTemplate( 
    input_variables=["context","question"], 
    template="基于以下上下文回答问题，并引用信息来源：\n{context}\n\n问题：{question}"
) 

# 检索到的上下文 
context = "根据《Python 编程从入门到精通》一书，Python 是一种高级编程语言，易于学习和使用。" 

# 提问 
question = "Python 是什么？" 

# 生成回答 
result = llm(prompt.format(context=context, question=question)) 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings()
# 创建向量数据库 
documents = ["公司的请假政策是：病假需要提供医院证明..."] 
db = FAISS.from_texts(documents, embeddings)
# 更新知识库 
new_document = "公司的请假政策已更新：病假需要提供三甲医院证明..." 
db.add_texts([new_document])
# 检索相关文档 
query = "公司的请假政策是什么？" 
docs = db.similarity_search(query, k=1) 
print(docs[0].page_content)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQAWithSourcesChain 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts([{"content":"Python 是一种高级编程语言，易于学习和使用。","metadata":{"source":"《Python 编程从入门到精通》"}}], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQAWithSourcesChain.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain({"question":"Python 是什么？"}) 
print(f"回答：{result['answer']}") 
print(f"来源：{result['sources']}")

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains.summarize import load_summarize_chain 
from langchain.llms import OpenAI 
from langchain.text_splitter import CharacterTextSplitter 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings()
# 加载文档
with open("example.txt", "r", encoding="utf-8") as f: 
    text = f.read()
# 分割文本 
text_splitter = CharacterTextSplitter() 
texts = text_splitter.split_text(text)
# 创建向量数据库 
db = FAISS.from_texts(texts, embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建摘要链 
chain = load_summarize_chain(llm, chain_type="map_reduce")
# 检索相关文档 
query = "本文的主要内容是什么？" 
docs = db.similarity_search(query, k=5)
# 生成摘要 
result = chain.run(documents=docs) 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
import requests 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings()
# 加载最新的日历数据 
response = requests.get("https://api.example.com/calendar/2026") 
calendar_data = response.json()
# 创建向量数据库 
db = FAISS.from_texts([str(calendar_data)], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("2026 年的春节是哪一天？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings()
# 加载医疗知识库
with open("medical_knowledge_base.txt", "r", encoding="utf-8") as f: 
    medical_data = f.read()
# 创建向量数据库 
db = FAISS.from_texts([medical_data], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("如何治疗感冒？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型 
embeddings = OpenAIEmbeddings()
# 加载敏感数据
with open("sensitive_data.txt", "r", encoding="utf-8") as f: 
    sensitive_data = f.read()
# 创建向量数据库 
db = FAISS.from_texts([sensitive_data], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 设置访问权限 
access_control = {"admin":True,"user":False}
# 检查访问权限 
user_role = "admin" 
if access_control[user_role]:
    # 提问 
    result = qa_chain.run("敏感数据是什么？") 
    print(result)
else:
    print("您没有访问权限。")

	RAG	SFT
数据类型	动态数据，RAG 不断查询外部源，确保信息保持最新，而无需频繁的模型重新训练。	（相对）静态数据，并且在动态数据场景中可能很快就会过时，SFT 也不能保证记住这些知识。
外部知识利用	RAG 擅长利用外部资源，通过在生成响应之前从知识源检索相关信息来增强 LLM 能力。它非常适合文档或其他结构化/非结构化数据库。	SFT 可以对 LLM 进行微调以对齐预训练学到的外部知识，但对于频繁更改的数据源来说可能不太实用。
模型定制	RAG 主要关注信息检索，擅长整合外部知识，但可能无法完全定制模型的行为或写作风格。	SFT 允许根据特定的语气或术语调整 LLM 的行为、写作风格或特定领域的知识。
减少幻觉	RAG 本质上不太容易产生幻觉，因为每个回答都建立在检索到的证据上。	SFT 可以通过将模型基于特定领域的训练数据来帮助减少幻觉，但当面对不熟悉的输入时，它仍然可能产生幻觉。
透明度	RAG 系统通过将响应生成分解为不同的阶段来提供透明度，提供对数据检索的匹配度以提高对输出的信任。	SFT 就像一个黑匣子，使得响应背后的推理更加不透明。
技术要求	RAG 需要高效的检索策略和大型数据库相关技术，另外还需要保持外部数据源集成以及数据更新。	SFT 需要准备和整理高质量的训练数据集，定义微调目标以及相应的计算资源。

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
from transformers import pipeline 

# RAG 示例 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["最新科技进展：GPT-5 发布..."], embeddings) 
llm = OpenAI(temperature=0) 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 
rag_result = qa_chain.run("最新的科技进展是什么？") 
print(f"RAG 回答：{rag_result}")

# SFT 示例 
sft_model = pipeline('text-generation', model='fine_tuned_model') 
sft_result = sft_model("最新的科技进展是什么？", max_length=100, num_return_sequences=1) 
print(f"SFT 回答：{sft_result[0]['generated_text']}")

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.text_splitter import CharacterTextSplitter 
import PyPDF2 

# 提取 PDF 文本
def extract_text_from_pdf(pdf_path): 
    text = "" 
    with open(pdf_path, "rb") as f: 
        reader = PyPDF2.PdfReader(f) 
        for page in reader.pages: 
            text += page.extract_text() 
    return text 

# 分割文本 
text_splitter = CharacterTextSplitter()
# 向量化 
embeddings = OpenAIEmbeddings()
# 创建索引
def create_index(pdf_path): 
    text = extract_text_from_pdf(pdf_path) 
    texts = text_splitter.split_text(text) 
    db = FAISS.from_texts(texts, embeddings) 
    db.save_local("pdf_index")
# 创建 PDF 索引 
create_index("example.pdf")

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 

# 加载索引 
embeddings = OpenAIEmbeddings() 
db = FAISS.load_local("pdf_index", embeddings)
# 检索 
query = "Python 学习教程" 
docs = db.similarity_search(query, k=3) 
for doc in docs:
    print(doc.page_content)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 加载索引 
embeddings = OpenAIEmbeddings() 
db = FAISS.load_local("pdf_index", embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("如何学习 Python？") 
print(result)

import requests 
import PyPDF2 
from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 提取 PDF 文本
def extract_text_from_pdf(pdf_path): 
    text = "" 
    with open(pdf_path, "rb") as f: 
        reader = PyPDF2.PdfReader(f) 
        for page in reader.pages: 
            text += page.extract_text() 
    return text 

# 创建索引
def create_chat_pdf(pdf_path): 
    text = extract_text_from_pdf(pdf_path) 
    embeddings = OpenAIEmbeddings() 
    db = FAISS.from_texts([text], embeddings) 
    db.save_local("chat_pdf_index")

# 提问
def chat_with_pdf(question): 
    embeddings = OpenAIEmbeddings() 
    db = FAISS.load_local("chat_pdf_index", embeddings) 
    llm = OpenAI(temperature=0) 
    qa_chain = RetrievalQA.from_chain_type( 
        llm=llm, 
        chain_type="stuff", 
        retriever=db.as_retriever()
    ) 
    result = qa_chain.run(question) 
    return result 

# 创建 ChatPDF 索引 
create_chat_pdf("example.pdf")
# 提问 
answer = chat_with_pdf("本文的主要内容是什么？") 
print(answer)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
from langchain.prompts import PromptTemplate 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建 Prompt 模板 
prompt = PromptTemplate( 
    input_variables=["context","question"], 
    template="理解用户意图：{question}\n基于以下上下文回答问题：{context}\n\n问题：{question}"
)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(), 
    chain_type_kwargs={"prompt": prompt}
)
# 提问 
result = qa_chain.run("如何做红烧肉？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
from PIL import Image 
import requests 
from io import BytesIO 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫在草地上玩耍的图片：https://example.com/cat.jpg"], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("生成一只猫在草地上玩耍的图片") 
print(result)
# 显示图片 
image_url = result.split("：")[-1].strip() 
response = requests.get(image_url) 
image = Image.open(BytesIO(response.content)) 
image.show()

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫是一种哺乳动物...","狗是一种哺乳动物..."], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("如何训练一只狗？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫是一种哺乳动物...","狗是一种哺乳动物..."], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
# 提问 
result = qa_chain.run("猫是一种什么动物？") 
print(result)

import time 
from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫是一种哺乳动物...","狗是一种哺乳动物...","鸟是一种脊椎动物...","鱼是一种脊椎动物..."], embeddings)
# 初始化 LLM 
llm = OpenAI(temperature=0)
# 创建检索 QA 链（检索 2 个文档） 
qa_chain_2 = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(search_kwargs={"k":2})
)
# 创建检索 QA 链（检索 4 个文档） 
qa_chain_4 = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(search_kwargs={"k":4})
)
# 提问并计时 
start_time = time.time() 
result_2 = qa_chain_2.run("猫是一种什么动物？") 
end_time = time.time() 
print(f"检索 2 个文档耗时：{end_time - start_time}秒") 
start_time = time.time() 
result_4 = qa_chain_4.run("猫是一种什么动物？") 
end_time = time.time() 
print(f"检索 4 个文档耗时：{end_time - start_time}秒")

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫是一种爬行动物...（来源：不可靠网站）"], embeddings) 
# 初始化 LLM 
llm = OpenAI(temperature=0) 
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 
# 提问 
result = qa_chain.run("猫是一种什么动物？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
from PIL import Image 
import pytesseract 

# 提取图片文本 
def extract_text_from_image(image_path): 
    image = Image.open(image_path) 
    text = pytesseract.image_to_string(image) 
    return text 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["猫是一种哺乳动物..."], embeddings) 
# 初始化 LLM 
llm = OpenAI(temperature=0) 
# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 
# 提取图片文本 
image_text = extract_text_from_image("cat.jpg") 
# 提问 
result = qa_chain.run(f"这张图片中的动物是什么？图片文本：{image_text}") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
import requests 

# 实时获取科技新闻 
def get_latest_tech_news(): 
    response = requests.get("https://newsapi.org/v2/top-headlines?country=us&category=technology&apiKey=YOUR_API_KEY") 
    news = response.json() 
    return news['articles'][0]['content'] 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts([get_latest_tech_news()], embeddings) 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
) 

# 提问 
result = qa_chain.run("最新的科技新闻是什么？") 
print(result)

from langchain.vectorstores import FAISS 
from langchain.embeddings import OpenAIEmbeddings 
from langchain.chains import RetrievalQA 
from langchain.llms import OpenAI 
from langchain.prompts import PromptTemplate 

# 初始化嵌入模型和向量数据库 
embeddings = OpenAIEmbeddings() 
db = FAISS.from_texts(["《肖申克的救赎》是一部经典的剧情片...", "《阿甘正传》是一部励志的剧情片...", "《星际穿越》是一部科幻片..."], embeddings) 

# 初始化 LLM 
llm = OpenAI(temperature=0) 

# 获取用户偏好 
user_preference = "剧情片" 

# 创建 Prompt 模板 
prompt = PromptTemplate( 
    input_variables=["context", "question", "user_preference"], 
    template="用户偏好：{user_preference}\n基于以下上下文回答问题：{context}\n\n问题：{question}" 
) 

# 创建检索 QA 链 
qa_chain = RetrievalQA.from_chain_type( 
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(), 
    chain_type_kwargs={"prompt": prompt}
) 

# 提问 
result = qa_chain.run({"question": "推荐一些适合我的电影", "user_preference": user_preference}) 
print(result)

RAG 技术详解：解决大模型痛点与低成本 AI 升级方案

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

1.1 幻觉问题：一本正经地胡说八道

1.2 时效性问题：知识更新不及时

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 数据安全问题：敏感信息泄露风险

二、RAG 技术：检索增强生成

2.1 RAG 的定义

2.2 RAG 的架构

2.2.1 检索器模块

2.2.2 生成器模块

三、使用 RAG 的八大优势

3.1 可扩展性：减少模型大小和训练成本

3.2 准确性：通过引用信息来源增强信任

3.3 可控性：允许更新或定制知识

3.4 可解释性：检索到的项目作为模型预测中来源的参考

3.5 多功能性：适用于多种任务

3.6 及时性：识别最新的信息

3.7 定制性：为不同领域提供专业的知识支持

3.8 安全性：更好地控制数据使用

四、RAG 与 SFT 的对比

4.1 数据处理方式

五、RAG 的典型实现方法

5.1 数据索引

5.2 数据检索

5.3 文本生成

六、RAG 的典型案例

6.1 ChatPDF 及其复刻版

6.2 Baichuan

6.3 Multi-modal retrieval-based LMs

七、RAG 存在的问题

7.1 检索效果依赖 embedding 和检索算法

7.2 大模型如何利用检索到的信息仍是黑盒

7.3 效率问题：无差别检索所有任务

7.4 无法精准查证事实

八、RAG 的拓展方案

8.1 多模态 RAG

8.2 实时 RAG

8.3 个性化 RAG

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具