PythonAI算法

大模型 RAG 技术深度解析：低成本实现 AI 升级

大模型面临幻觉与数据滞后挑战，检索增强生成（RAG）通过外挂知识库有效降低成本。解析 RAG 架构、优势及实现方案，对比 SFT 差异，并提供 Python 代码示例，助您快速落地企业级 AI 应用。

无尘发布于 2026/3/24更新于 2026/5/89 浏览

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

在实际应用中，我们常发现通用大模型存在几个明显短板。首先是幻觉问题，模型基于概率生成文本，并不真正理解语义，容易一本正经地胡说八道。比如询问'太阳为什么从西边升起'，它可能会编造地球自转改变的理由。

其次是时效性。训练成本高导致模型知识更新慢，无法回答最新事件。例如 2026 年的春节日期，若训练数据截止 2023 年，模型将无法给出正确答案。

最后是数据安全。企业敏感信息不能直接输入公共 LLM。通常做法是在本地处理脱敏后，再让在线模型进行归纳。

from transformers import pipeline

generator = pipeline('text-generation', model='gpt2')
result = generator("太阳为什么从西边升起？", max_length=100, num_return_sequences=1)
print(result[0]['generated_text'])

对于时效性和安全需求，我们可以结合外部工具解决：

from datetime import datetime
import requests

def get_current_time():
    return datetime.now().strftime("%Y-%m-%d %H:%M:%S")

def get_latest_news():
    response = requests.get("https://newsapi.org/v2/top-headlines?country=cn&apiKey=YOUR_API_KEY")
    return response.json()

print(f"当前时间：{get_current_time()}")
print(f"最新新闻：{get_latest_news()}")

在处理敏感数据时，建议先本地脱敏：

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# 本地处理敏感数据
def process_sensitive_data():
     data.replace(, )

llm = OpenAI(temperature=)
prompt = PromptTemplate(input_variables=[], template=)
chain = LLMChain(llm=llm, prompt=prompt)

sensitive_data = 
processed_data = process_sensitive_data(sensitive_data)
result = chain.run(processed_data)
(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()
documents = ["Python 学习资源 1...", "Python 学习资源 2..."]
db = FAISS.from_texts(documents, embeddings)

query = "如何学习 Python"
docs = db.similarity_search(query, k=2)
for doc in docs:
    print(doc.page_content)

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

llm = OpenAI(temperature=0)
prompt = PromptTemplate(
    input_variables=["context", "question"],
    template="基于以下上下文回答问题：\n{context}\n\n问题：{question}"
)

context = "Python 是一种高级编程语言，易于学习和使用。"
question = "Python 是什么？"
result = llm(prompt.format(context=context, question=question))
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

result = qa_chain.run("如何做红烧肉？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

embeddings = OpenAIEmbeddings()
db = FAISS.load_local("enterprise_knowledge_base", embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

result = qa_chain.run("公司的请假政策是什么？")
print(result)

from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

llm = OpenAI(temperature=0)
prompt = PromptTemplate(
    input_variables=["context", "question"],
    template="基于以下上下文回答问题，并引用信息来源：\n{context}\n\n问题：{question}"
)

context = "根据《Python 编程从入门到精通》一书，Python 是一种高级编程语言。"
question = "Python 是什么？"
result = llm(prompt.format(context=context, question=question))
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()
documents = ["公司的请假政策是：病假需要提供医院证明..."]
db = FAISS.from_texts(documents, embeddings)

new_document = "公司的请假政策已更新：病假需要提供三甲医院证明..."
db.add_texts([new_document])

query = "公司的请假政策是什么？"
docs = db.similarity_search(query, k=1)
print(docs[0].page_content)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQAWithSourcesChain
from langchain.llms import OpenAI

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts([
    {"content": "Python 是一种高级编程语言", "metadata": {"source": "《Python 编程从入门到精通》"}}
], embeddings)

llm = OpenAI(temperature=0)
qa_chain = RetrievalQAWithSourcesChain.from_chain_type(
    llm=llm, chain_type="stuff", retriever=db.as_retriever()
)

result = qa_chain({"question": "Python 是什么？"})
print(f"回答：{result['answer']}")
print(f"来源：{result['sources']}")

维度	RAG	SFT
数据类型	动态数据，查询外部源，保持最新	静态数据，频繁更改场景不适用
外部知识利用	擅长整合外部资源，适合结构化/非结构化库	微调对齐预训练知识，不适合频繁变更
模型定制	关注检索，难以完全定制行为风格	允许调整语气、术语或特定领域知识
减少幻觉	基于检索证据，不易产生幻觉	依赖训练数据，面对未知输入仍可能幻觉
透明度	分解响应阶段，提供检索匹配度	黑匣子，推理不透明
技术要求	高效检索策略、数据库集成	高质量数据集、计算资源

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from transformers import pipeline

# RAG 示例
embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["最新科技进展：GPT-5 发布..."], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())
rag_result = qa_chain.run("最新的科技进展是什么？")
print(f"RAG 回答：{rag_result}")

# SFT 示例
sft_model = pipeline('text-generation', model='fine_tuned_model')
sft_result = sft_model("最新的科技进展是什么？", max_length=100, num_return_sequences=1)
print(f"SFT 回答：{sft_result[0]['generated_text']}")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
import PyPDF2

def extract_text_from_pdf(pdf_path):
    text = ""
    with open(pdf_path, "rb") as f:
        reader = PyPDF2.PdfReader(f)
        for page in reader.pages:
            text += page.extract_text()
    return text

text_splitter = CharacterTextSplitter()
embeddings = OpenAIEmbeddings()

def create_index(pdf_path):
    text = extract_text_from_pdf(pdf_path)
    texts = text_splitter.split_text(text)
    db = FAISS.from_texts(texts, embeddings)
    db.save_local("pdf_index")

create_index("example.pdf")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings

embeddings = OpenAIEmbeddings()
db = FAISS.load_local("pdf_index", embeddings)

query = "Python 学习教程"
docs = db.similarity_search(query, k=3)
for doc in docs:
    print(doc.page_content)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

embeddings = OpenAIEmbeddings()
db = FAISS.load_local("pdf_index", embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

result = qa_chain.run("如何学习 Python？")
print(result)

import requests
import PyPDF2
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

def extract_text_from_pdf(pdf_path):
    text = ""
    with open(pdf_path, "rb") as f:
        reader = PyPDF2.PdfReader(f)
        for page in reader.pages:
            text += page.extract_text()
    return text

def create_chat_pdf(pdf_path):
    text = extract_text_from_pdf(pdf_path)
    embeddings = OpenAIEmbeddings()
    db = FAISS.from_texts([text], embeddings)
    db.save_local("chat_pdf_index")

def chat_with_pdf(question):
    embeddings = OpenAIEmbeddings()
    db = FAISS.load_local("chat_pdf_index", embeddings)
    llm = OpenAI(temperature=0)
    qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())
    result = qa_chain.run(question)
    return result

create_chat_pdf("example.pdf")
answer = chat_with_pdf("本文的主要内容是什么？")
print(answer)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["红烧肉的做法：1. 准备食材..."], embeddings)
llm = OpenAI(temperature=0)

prompt = PromptTemplate(
    input_variables=["context", "question"],
    template="理解用户意图：{question}\n基于以下上下文回答问题：{context}\n\n问题：{question}"
)

qa_chain = RetrievalQA.from_chain_type(
    llm=llm, chain_type="stuff", retriever=db.as_retriever(),
    chain_type_kwargs={"prompt": prompt}
)

result = qa_chain.run("如何做红烧肉？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from PIL import Image
import requests
from io import BytesIO

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫在草地上玩耍的图片：https://example.com/cat.jpg"], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

result = qa_chain.run("生成一只猫在草地上玩耍的图片")
print(result)

image_url = result.split("：")[-1].strip()
response = requests.get(image_url)
image = Image.open(BytesIO(response.content))
image.show()

import time
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物...", "狗是一种哺乳动物...", "鸟是一种脊椎动物...", "鱼是一种脊椎动物..."], embeddings)
llm = OpenAI(temperature=0)

qa_chain_2 = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever(search_kwargs={"k": 2}))
qa_chain_4 = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever(search_kwargs={"k": 4}))

start_time = time.time()
result_2 = qa_chain_2.run("猫是一种什么动物？")
end_time = time.time()
print(f"检索 2 个文档耗时：{end_time - start_time}秒")

start_time = time.time()
result_4 = qa_chain_4.run("猫是一种什么动物？")
end_time = time.time()
print(f"检索 4 个文档耗时：{end_time - start_time}秒")

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from PIL import Image
import pytesseract

def extract_text_from_image(image_path):
    image = Image.open(image_path)
    text = pytesseract.image_to_string(image)
    return text

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["猫是一种哺乳动物..."], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

image_text = extract_text_from_image("cat.jpg")
result = qa_chain.run(f"这张图片中的动物是什么？图片文本：{image_text}")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
import requests

def get_latest_tech_news():
    response = requests.get("https://newsapi.org/v2/top-headlines?country=us&category=technology&apiKey=YOUR_API_KEY")
    news = response.json()
    return news['articles'][0]['content']

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts([get_latest_tech_news()], embeddings)
llm = OpenAI(temperature=0)
qa_chain = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=db.as_retriever())

result = qa_chain.run("最新的科技新闻是什么？")
print(result)

from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI
from langchain.prompts import PromptTemplate

embeddings = OpenAIEmbeddings()
db = FAISS.from_texts(["《肖申克的救赎》是一部经典的剧情片...", "《阿甘正传》是一部励志的剧情片...", "《星际穿越》是一部科幻片..."], embeddings)
llm = OpenAI(temperature=0)
user_preference = "剧情片"

prompt = PromptTemplate(
    input_variables=["context", "question", "user_preference"],
    template="用户偏好：{user_preference}\n基于以下上下文回答问题：{context}\n\n问题：{question}"
)

qa_chain = RetrievalQA.from_chain_type(
    llm=llm, chain_type="stuff", retriever=db.as_retriever(),
    chain_type_kwargs={"prompt": prompt}
)

result = qa_chain.run({"question": "推荐一些适合我的电影", "user_preference": user_preference})
print(result)

大模型 RAG 技术深度解析：低成本实现 AI 升级

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

大模型 RAG 技术深度解析：低成本实现 AI 升级

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

更多推荐文章

相关免费在线工具

二、RAG 技术：检索增强生成

1. 架构组成

三、使用 RAG 的八大优势

四、RAG 与 SFT 的对比

五、RAG 的典型实现方法

1. 数据索引

2. 数据检索

3. 文本生成

六、RAG 的典型案例

1. ChatPDF 复刻版

2. Baichuan 搜索增强

3. 多模态检索

七、RAG 存在的问题

八、RAG 的拓展方案

1. 多模态 RAG

2. 实时 RAG

3. 个性化 RAG

更多推荐文章

相关免费在线工具

大模型 RAG 技术深度解析：低成本实现 AI 升级

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

大模型 RAG 技术深度解析：低成本实现 AI 升级

大模型 RAG 技术深度解析：从入门到进阶

一、大语言模型（LLM）的三大痛点

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

二、RAG 技术：检索增强生成

1. 架构组成

三、使用 RAG 的八大优势

四、RAG 与 SFT 的对比

五、RAG 的典型实现方法

1. 数据索引

2. 数据检索

3. 文本生成

六、RAG 的典型案例

1. ChatPDF 复刻版

2. Baichuan 搜索增强

3. 多模态检索

七、RAG 存在的问题

八、RAG 的拓展方案

1. 多模态 RAG

2. 实时 RAG

3. 个性化 RAG

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具