PythonAI算法

RAG 技术深度解析：低成本替代微调实现 AI 升级

RAG 技术通过检索增强生成有效解决了大模型幻觉、知识滞后及数据安全问题。相比微调（SFT），RAG 无需重新训练模型即可接入外部知识库，显著降低部署成本并提升回答准确性与可解释性。本文深入解析 RAG 架构、核心优势、典型实现流程及多模态拓展方案，并提供 Python 代码示例，帮助开发者快速落地低成本 AI 应用。

云间漫步发布于 2026/4/8更新于 2026/7/2036 浏览

RAG 技术示意图

一、大语言模型（LLM）的三大痛点

大语言模型痛点

1.1 幻觉问题：一本正经地胡说八道

大模型的文本生成基于概率预测，它并不真正理解语义的正确性。通俗来说，就像学生遇到不会的题目凭记忆瞎蒙答案，虽然看起来像模像样，但实际上可能完全错误。

比如当你问 AI'太阳为什么从西边升起？'，它可能会解释'因为地球自转方向发生了改变'，而实际上太阳根本不会从西边升起。这种幻觉在关键业务中是致命的。

from transformers import pipeline

generator = pipeline('text-generation', model='gpt2')
result = generator("太阳为什么从西边升起？", max_length=100, num_return_sequences=1)
print(result[0]['generated_text'])

1.2 时效性问题：知识更新不及时

大型语言模型的训练成本极高且周期长，导致实时数据无法及时参与训练。这就好比一个只会背诵五年前课本知识的学生，无法回答最新的科技进展或热点事件。

例如在 2026 年问 AI'2026 年的春节是哪一天？'，如果训练数据截止到 2023 年，它大概率无法给出正确答案。此时需要结合外部实时数据源。

from datetime import datetime
import requests

def get_current_time():
    return datetime.now().strftime("%Y-%m-%d %H:%M:%S")

def get_latest_news():
    response = requests.get("https://newsapi.org/v2/top-headlines?country=cn&apiKey=YOUR_API_KEY")
    return response.json()

print(f"当前时间：{get_current_time()}")
print()

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 本地处理敏感数据
def process_sensitive_data(data):
    # 脱敏处理
    return data.replace("敏感信息", "***")

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建 Prompt 模板
prompt = PromptTemplate(
    input_variables=["data"], 
    template="分析以下数据：{data}"
)

# 创建 LLM Chain
chain = LLMChain(llm=llm, prompt=prompt)

# 处理敏感数据
sensitive_data = "用户的敏感信息：1234567890"
processed_data = process_sensitive_data(sensitive_data)

# 调用 LLM 进行分析
result = chain.run(processed_data)
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("如何做红烧肉？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 创建向量数据库
documents = ["Python 学习资源 1...", "Python 学习资源 2...", "Python 学习资源 3..."]
db = FAISS.from_texts(documents, embeddings)

# 检索相关文档
query = "如何学习 Python"
docs = db.similarity_search(query, k=2)
for doc in docs:
    print(doc.page_content)

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建 Prompt 模板
prompt = PromptTemplate(
    input_variables=["context", "question"], 
    template="基于以下上下文回答问题：\n{context}\n\n问题：{question}"
)

# 检索到的上下文
context = "Python 是一种高级编程语言，易于学习和使用。"

# 提问
question = "Python 是什么？"

# 生成回答
result = llm(prompt.format(context=context, question=question))
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
# 加载企业内部知识库
db = FAISS.load_local("enterprise_knowledge_base", embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("公司的请假政策是什么？")
print(result)

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建 Prompt 模板
prompt = PromptTemplate(
    input_variables=["context", "question"], 
    template="基于以下上下文回答问题，并引用信息来源：\n{context}\n\n问题：{question}"
)

# 检索到的上下文
context = "根据《Python 编程从入门到精通》一书，Python 是一种高级编程语言，易于学习和使用。"

# 提问
question = "Python 是什么？"

# 生成回答
result = llm(prompt.format(context=context, question=question))
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 创建向量数据库
documents = ["公司的请假政策是：病假需要提供医院证明..."]
db = FAISS.from_texts(documents, embeddings)

# 更新知识库
new_document = "公司的请假政策已更新：病假需要提供三甲医院证明..."
db.add_texts([new_document])

# 检索相关文档
query = "公司的请假政策是什么？"
docs = db.similarity_search(query, k=1)
print(docs[0].page_content)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQAWithSourcesChain
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts([{"content":"Python 是一种高级编程语言，易于学习和使用。","metadata":{"source":"《Python 编程从入门到精通》"}}], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQAWithSourcesChain.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain({"question": "Python 是什么？"})
print(f"回答：{result['answer']}")
print(f"来源：{result['sources']}")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains.summarize import load_summarize_chain
from langchain.llms import OpenAI
from langchain.text_splitter import CharacterTextSplitter

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 加载文档
with open("example.txt", "r", encoding="utf-8") as f:
    text = f.read()

# 分割文本
text_splitter = CharacterTextSplitter()
texts = text_splitter.split_text(text)

# 创建向量数据库
db = FAISS.from_texts(texts, embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建摘要链
chain = load_summarize_chain(llm, chain_type="map_reduce")

# 检索相关文档
query = "本文的主要内容是什么？"
docs = db.similarity_search(query, k=5)

# 生成摘要
result = chain.run(documents=docs)
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
import requests

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 加载最新的日历数据
response = requests.get("https://api.example.com/calendar/2026")
calendar_data = response.json()

# 创建向量数据库
db = FAISS.from_texts([str(calendar_data)], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("2026 年的春节是哪一天？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 加载医疗知识库
with open("medical_knowledge_base.txt", "r", encoding="utf-8") as f:
    medical_data = f.read()

# 创建向量数据库
db = FAISS.from_texts([medical_data], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("如何治疗感冒？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型
embeddings = OpenAIEmbeddings()

# 加载敏感数据
with open("sensitive_data.txt", "r", encoding="utf-8") as f:
    sensitive_data = f.read()

# 创建向量数据库
db = FAISS.from_texts([sensitive_data], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 设置访问权限
access_control = {"admin": True, "user": False}

# 检查访问权限
user_role = "admin"
if access_control[user_role]:
    result = qa_chain.run("敏感数据是什么？")
    print(result)
else:
    print("您没有访问权限。")

	RAG	SFT
数据类型	动态数据，不断查询外部源，确保信息保持最新，无需频繁重训。	（相对）静态数据，动态场景中易过时，不能保证记住新知识。
外部知识利用	擅长利用外部资源，在生成前检索相关信息增强能力，适合文档库。	可对 LLM 微调以对齐预训练知识，但对频繁更改的数据源不实用。
模型定制	关注信息检索，整合外部知识，但难以完全定制行为或写作风格。	允许调整 LLM 行为、风格或特定领域知识。
减少幻觉	基于检索证据回答，本质上不易产生幻觉。	可减少幻觉，但面对不熟悉输入仍可能产生幻觉。
透明度	分解响应生成阶段，提供数据检索匹配度，提高信任。	黑匣子模式，推理过程不透明。
技术要求	需高效检索策略、大型数据库技术及外部数据集成。	需准备高质量数据集、定义微调目标及计算资源。

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from transformers import pipeline

# RAG 示例
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["最新科技进展：GPT-5 发布..."], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)
rag_result = qa_chain.run("最新的科技进展是什么？")
print(f"RAG 回答：{rag_result}")

# SFT 示例
sft_model = pipeline('text-generation', model='fine_tuned_model')
sft_result = sft_model("最新的科技进展是什么？", max_length=100, num_return_sequences=1)
print(f"SFT 回答：{sft_result[0]['generated_text']}")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
import PyPDF2

# 提取 PDF 文本
def extract_text_from_pdf(pdf_path):
    text = ""
    with open(pdf_path, "rb") as f:
        reader = PyPDF2.PdfReader(f)
        for page in reader.pages:
            text += page.extract_text()
    return text

# 分割文本
text_splitter = CharacterTextSplitter()

# 向量化
embeddings = OpenAIEmbeddings()

# 创建索引
def create_index(pdf_path):
    text = extract_text_from_pdf(pdf_path)
    texts = text_splitter.split_text(text)
    db = FAISS.from_texts(texts, embeddings)
    db.save_local("pdf_index")

# 创建 PDF 索引
create_index("example.pdf")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

# 加载索引
embeddings = OpenAIEmbeddings()
db = FAISS.load_local("pdf_index", embeddings)

# 检索
query = "Python 学习教程"
docs = db.similarity_search(query, k=3)
for doc in docs:
    print(doc.page_content)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 加载索引
embeddings = OpenAIEmbeddings()
db = FAISS.load_local("pdf_index", embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("如何学习 Python？")
print(result)

import requests
import PyPDF2
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 提取 PDF 文本
def extract_text_from_pdf(pdf_path):
    text = ""
    with open(pdf_path, "rb") as f:
        reader = PyPDF2.PdfReader(f)
        for page in reader.pages:
            text += page.extract_text()
    return text

# 创建索引
def create_chat_pdf(pdf_path):
    text = extract_text_from_pdf(pdf_path)
    embeddings = OpenAIEmbeddings()
    db = FAISS.from_texts([text], embeddings)
    db.save_local("chat_pdf_index")

# 提问
def chat_with_pdf(question):
    embeddings = OpenAIEmbeddings()
    db = FAISS.load_local("chat_pdf_index", embeddings)
    llm = OpenAI(temperature=0)
    qa_chain = RetrievalQA.from_chain_type(
        llm=llm, 
        chain_type="stuff", 
        retriever=db.as_retriever()
    )
    result = qa_chain.run(question)
    return result

# 创建 ChatPDF 索引
create_chat_pdf("example.pdf")

# 提问
answer = chat_with_pdf("本文的主要内容是什么？")
print(answer)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建 Prompt 模板
prompt = PromptTemplate(
    input_variables=["context", "question"], 
    template="理解用户意图：{question}\n基于以下上下文回答问题：{context}\n\n问题：{question}"
)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(), 
    chain_type_kwargs={"prompt": prompt}
)

# 提问
result = qa_chain.run("如何做红烧肉？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from PIL import Image
import requests
from io import BytesIO

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫在草地上玩耍的图片：https://example.com/cat.jpg"], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("生成一只猫在草地上玩耍的图片")
print(result)

# 显示图片
image_url = result.split("：")[-1].strip()
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))
image.show()

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物...", "狗是一种哺乳动物..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("如何训练一只狗？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物...", "狗是一种哺乳动物..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("猫是一种什么动物？")
print(result)

import time
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物...", "狗是一种哺乳动物...", "鸟是一种脊椎动物...", "鱼是一种脊椎动物..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链（检索 2 个文档）
qa_chain_2 = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(search_kwargs={"k":2})
)

# 创建检索 QA 链（检索 4 个文档）
qa_chain_4 = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(search_kwargs={"k":4})
)

# 提问并计时
start_time = time.time()
result_2 = qa_chain_2.run("猫是一种什么动物？")
end_time = time.time()
print(f"检索 2 个文档耗时：{end_time - start_time}秒")

start_time = time.time()
result_4 = qa_chain_4.run("猫是一种什么动物？")
end_time = time.time()
print(f"检索 4 个文档耗时：{end_time - start_time}秒")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种爬行动物...（来源：不可靠网站）"], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("猫是一种什么动物？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from PIL import Image
import pytesseract

# 提取图片文本
def extract_text_from_image(image_path):
    image = Image.open(image_path)
    text = pytesseract.image_to_string(image)
    return text

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提取图片文本
image_text = extract_text_from_image("cat.jpg")

# 提问
result = qa_chain.run(f"这张图片中的动物是什么？图片文本：{image_text}")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
import requests

# 实时获取科技新闻
def get_latest_tech_news():
    response = requests.get("https://newsapi.org/v2/top-headlines?country=us&category=technology&apiKey=YOUR_API_KEY")
    news = response.json()
    return news['articles'][0]['content']

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts([get_latest_tech_news()], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever()
)

# 提问
result = qa_chain.run("最新的科技新闻是什么？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

# 初始化嵌入模型和向量数据库
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["《肖申克的救赎》是一部经典的剧情片...", "《阿甘正传》是一部励志的剧情片...", "《星际穿越》是一部科幻片..."], embeddings)

# 初始化 LLM
llm = OpenAI(temperature=0)

# 获取用户偏好
user_preference = "剧情片"

# 创建 Prompt 模板
prompt = PromptTemplate(
    input_variables=["context", "question", "user_preference"], 
    template="用户偏好：{user_preference}\n基于以下上下文回答问题：{context}\n\n问题：{question}"
)

# 创建检索 QA 链
qa_chain = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=db.as_retriever(), 
    chain_type_kwargs={"prompt": prompt}
)

# 提问
result = qa_chain.run({"question": "推荐一些适合我的电影", "user_preference": user_preference})
print(result)

RAG 技术深度解析：低成本替代微调实现 AI 升级

一、大语言模型（LLM）的三大痛点

1.1 幻觉问题：一本正经地胡说八道

1.2 时效性问题：知识更新不及时

RAG 技术深度解析：低成本替代微调实现 AI 升级

一、大语言模型（LLM）的三大痛点

1.1 幻觉问题：一本正经地胡说八道

1.2 时效性问题：知识更新不及时

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.3 数据安全问题：敏感信息泄露风险

二、RAG 技术：检索增强生成

2.1 RAG 的定义

2.2 RAG 的架构

2.2.1 检索器模块

2.2.2 生成器模块

三、使用 RAG 的八大优势

3.1 可扩展性：减少模型大小和训练成本

3.2 准确性：通过引用信息来源增强信任

3.3 可控性：允许更新或定制知识

3.4 可解释性：检索到的项目作为模型预测中来源的参考

3.5 多功能性：适用于多种任务

3.6 及时性：识别最新的信息

3.7 定制性：为不同领域提供专业的知识支持

3.8 安全性：更好地控制数据使用

四、RAG 与 SFT 的对比

五、RAG 的典型实现方法

5.1 数据索引

5.2 数据检索

5.3 文本生成

六、RAG 的典型案例

6.1 ChatPDF 及其复刻版

6.2 Baichuan

6.3 Multi-modal retrieval-based LMs

七、RAG 存在的问题

7.1 检索效果依赖 embedding 和检索算法

7.2 大模型如何利用检索到的信息仍是黑盒

7.3 效率问题：无差别检索所有任务

7.4 无法精准查证事实

八、RAG 的拓展方案

8.1 多模态 RAG

8.2 实时 RAG

8.3 个性化 RAG

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具