基于大模型 API 与 RAG 知识库构建智能客服机器人实战

基于大模型 API 与 RAG 知识库构建智能客服机器人实战 | 极客日志

API_KEY=your_api_key_here
CHAT_URL=https://api.example.com/v1/chat/completions

pip install requests python-dotenv

import os
import requests
from dotenv import load_dotenv

# 1. 加载配置
load_dotenv()
API_KEY = os.getenv("API_KEY")
CHAT_URL = os.getenv("CHAT_URL")
HEADERS = {
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
}

# 2. 构造请求参数（Prompt 设计）
def build_chat_payload(user_message, system_prompt="你是专业的 AI 助手，回答简洁准确"):
    return {
        "model": "gpt-5",
        "messages": [
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_message}
        ],
        "temperature": 0.7,
        "max_tokens": 512
    }

# 3. 发送请求并解析结果
def call_llm_chat(user_message):
    payload = build_chat_payload(user_message)
    try:
        response = requests.post(CHAT_URL, headers=HEADERS, json=payload)
        response.raise_for_status()
        result = response.json()
        reply = result["choices"][0]["message"]["content"]
        token_usage = result["usage"]
        return {
            "success": True,
            "reply": reply,
            "token_used": token_usage["total_tokens"],
            "prompt_tokens": token_usage["prompt_tokens"],
            "completion_tokens": token_usage["completion_tokens"]
        }
    except requests.exceptions.RequestException as e:
        error_msg = str(e)
        if 'response' in locals():
            error_msg += f" | 错误详情：{response.json()}"
        return {"success": False, "error": error_msg}

# 4. 测试调用
if __name__ == "__main__":
    user_input = "用 Python 写一个快速排序算法，带注释"
    result = call_llm_chat(user_input)
    if result["success"]:
        print("AI 回复：\n", result["reply"])
        print(f"\nToken 消耗：总计{result['token_used']}（输入{result['prompt_tokens']}+输出{result['completion_tokens']}）")
    else:
        print("调用失败：", result["error"])

错误码	可能原因	解决方案
401	API Key 错误 / 已停用	检查 Key 是否正确，确认状态
403	模型未开通 / Key 权限不匹配	确认模型状态，重新创建对应类型 Key
429	QPS 超限	降低调用频率，或联系客服提升 QPS

模块	选型理由
核心接口	第三方大模型 API（GPT-5+RAG 知识库）
后端框架	Flask（轻量 Web 框架）
会话缓存	内存字典（Python 内置）
前端	HTML+CSS+JavaScript
运行环境	Windows 10/11 + Python 3.13.5

ecommerce-ai-chatbot/
├── app.py # Flask 主程序
├── llm_client.py # 大模型 API 客户端
├── .env # 配置文件
├── requirements.txt # 依赖库
└── templates/
    └── index.html # 前端界面

flask==2.3.3
requests==2.31.0
python-dotenv==1.0.0

API_KEY=your_fusion_mode_api_key_here
CHAT_URL=https://api.example.com/v1/chat/completions

import os
import requests
from dotenv import load_dotenv

user_history = {}
load_dotenv()

class LLMClient:
    def __init__(self):
        self.api_key = os.getenv("API_KEY")
        self.chat_url = os.getenv("CHAT_URL")
        self.headers = {
            "Authorization": f"Bearer {self.api_key}",
            "Content-Type": "application/json"
        }

    def get_chat_reply(self, user_id, user_message):
        if user_id not in user_history:
            user_history[user_id] = []
        messages = [{"role": "system", "content": "你是电商 AI 客服，请根据知识库内容和用户问题，友好地回答。"}] + user_history[user_id] + [{"role": "user", "content": user_message}]
        payload = {
            "model": "gpt-5",
            "messages": messages,
            "temperature": 0.6,
            "max_tokens": 1024
        }
        try:
            response = requests.post(self.chat_url, headers=self.headers, json=payload)
            response.raise_for_status()
            result = response.json()
            reply = result["choices"][0]["message"]["content"]
            token_used = result["usage"]["total_tokens"]
            user_history[user_id].append({"role": "user", "content": user_message})
            user_history[user_id].append({"role": "assistant", "content": reply})
            user_history[user_id] = user_history[user_id][-20:]
            return {"success": True, "reply": reply, "token_used": token_used}
        except Exception as e:
            return {"success": False, "error": str(e)}

    def clear_user_history(self, user_id):
        if user_id in user_history:
            del user_history[user_id]

from flask import Flask, request, jsonify, render_template
import uuid
from llm_client import LLMClient

app = Flask(__name__)
llm_client = LLMClient()

@app.route("/")
def index():
    return render_template("index.html")

@app.route("/api/chat", methods=["POST"])
def chat():
    data = request.json
    user_id = data.get("user_id")
    user_message = data.get("message", "").strip()
    if not user_id:
        user_id = str(uuid.uuid4())
    if not user_message:
        return jsonify({"success": False, "error": "请输入有效消息"})
    result = llm_client.get_chat_reply(user_id, user_message)
    result["user_id"] = user_id
    return jsonify(result)

@app.route("/api/clear-history", methods=["POST"])
def clear_history():
    data = request.json
    user_id = data.get("user_id")
    if user_id:
        llm_client.clear_user_history(user_id)
        return jsonify({"success": True})
    return jsonify({"success": False, "error": "user_id 不能为空"}), 400

if __name__ == "__main__":
    app.run(host="127.0.0.1", port=5000, debug=True)

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>电商 AI 客服</title>
<style>
* { margin: 0; padding: 0; box-sizing: border-box; }
body { font-family: Arial, sans-serif; max-width: 800px; margin: 0 auto; padding: 20px; }
.chat-container { border: 1px solid #eee; border-radius: 8px; overflow: hidden; }
.chat-header { background: #2272f9; color: white; padding: 16px; font-size: 18px; }
.chat-history { height: 500px; overflow-y: auto; padding: 16px; background: #fafafa; }
.message { margin: 8px 0; max-width: 70%; padding: 12px; border-radius: 8px; line-height: 1.5; }
.user-message { background: #2272f9; color: white; margin-left: auto; }
.ai-message { background: #fff; border: 1px solid #eee; margin-right: auto; }
.input-container { display: flex; border-top: 1px solid #eee; }
input { flex: 1; padding: 12px 16px; border: none; outline: none; font-size: 14px; }
button { padding: 0 24px; background: #2272f9; color: white; border: none; cursor: pointer; font-size: 14px; }
</style>
</head>
<body>
<div class="chat-container">
<div class="chat-header">AI 客服（7×24 小时在线）</div>
<div class="chat-history" id="chat-history"><div style="color:#666;text-align:center;margin:8px 0;">欢迎咨询</div></div>
<div class="input-container">
<input type="text" id="message-input" placeholder="请输入您的问题"><button id="send-btn">发送</button>
</div>
</div>
<script>
let userId = localStorage.getItem("chat_userid");
const chatHistory = document.getElementById("chat-history");
const messageInput = document.getElementById("message-input");
const sendBtn = document.getElementById("send-btn");

function addMessage(content, isUser = false) {
    const messageDiv = document.createElement("div");
    messageDiv.className = isUser ? "message user-message" : "message ai-message";
    messageDiv.textContent = content;
    chatHistory.appendChild(messageDiv);
    chatHistory.scrollTop = chatHistory.scrollHeight;
}

async function sendMessage() {
    const message = messageInput.value.trim();
    if (!message) return;
    addMessage(message, true);
    messageInput.value = "";
    try {
        const response = await fetch("/api/chat", {
            method: "POST",
            : { :  },
            : .({ : userId, : message })
        });
         result =  response.();
         (result.) {
            (result.);
        }  {
            ();
        }
    }  (e) {
        ();
    }
}

sendBtn.(, sendMessage);
messageInput.(,  {  (e. === ) (); });
</script>
</body>
</html>

测试场景	实际效果	耗时	准确率
FAQ 匹配	直接返回知识库答案	<200ms	100%
多轮对话	基于内存历史保持上下文理解	300-400ms	90%
复杂问题	调用大模型生成个性化推荐	400-600ms	85%

人群 / 角色	推荐场景	核心价值
AI 开发者	智能客服、代码助手、多模态交互系统	快速集成多模型，降低开发成本
内容创作者	短视频脚本生成、图片素材制作、文案撰写	提升创作效率，降低素材成本
企业运营 / 客服团队	7×24 小时智能客服、客户问题自动分类	替代人工工作，降低运营成本
高校科研人员	前沿模型实验、学术数据分析	低成本调用顶尖模型，支持科研创新

基于大模型 API 与 RAG 知识库构建智能客服机器人实战

引言

第一部分：平台概览

1.1 平台定位与核心价值

1.2 平台特色功能亮点

第二部分：平台使用详解

2.1 平台注册与 API Key 创建（完整操作步骤）

步骤 1：注册与登录

步骤 2：模型服务开通

步骤 3：API Key 创建与 API URL 获取（核心凭证）

2.2 API 密钥管理与安全注意事项

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2.3 API 调用流程（Python 实战示例）

前提条件

步骤 1：环境准备

步骤 2：编写调用代码

步骤 3：常见问题排查

第三部分：实战应用案例 —— 智能客服机器人开发

3.1 项目背景与技术栈

应用场景

技术栈选型

3.2 核心功能设计

3.3 完整实现步骤（Windows 环境适配）

步骤 1：RAG 知识库创建（控制台操作）

步骤 2：创建融合模式 API Key（关键步骤）

步骤 3：项目结构与代码实现

3.1 项目结构

3.2 依赖库配置（requirements.txt）

3.3 配置文件更新 (.env)

3.4 大模型 API 客户端（llm_client.py）

3.5 Flask 主程序（app.py）

3.6 前端界面（templates/index.html）

步骤 3：Windows 环境部署与运行

3.1 环境准备

3.2 安装依赖与启动服务

3.4 效果展示与适用场景

功能测试结果

适用场景

局限性说明

第四部分：结语

4.1 平台核心优势总结

4.2 适用人群与场景

4.3 后续探索建议

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具