LLM 链式架构基础设计与实践 | 极客日志

PythonAI算法

LLM 链式架构基础设计与实践

综述由AI生成详细阐述了构建可靠 LLM 链式架构的核心方法。内容涵盖单一模型调用的局限性分析、模块化组件设计模式、提示词工程优化策略以及健壮的错误处理机制。通过智能问答系统的实战案例，展示了预处理、LLM 调用及后处理的完整流程。此外，还探讨了重试策略、降级方案、安全隐私保护及性能优化建议，为开发者提供了一套可复用、易维护的大模型应用开发框架。

观心发布于 2025/2/7更新于 2026/6/320 浏览

在构建复杂的大语言模型（LLM）应用时，单一的模型调用往往无法满足业务对稳定性、可维护性及复杂逻辑处理的需求。本文将详细介绍如何构建一个可靠的 LLM 链式架构，涵盖基础设计模式、提示词工程优化、错误处理机制以及安全与监控策略。

为什么需要链式架构？

在深入技术细节之前，理解单一模型调用的局限性至关重要：

单一模型调用的局限性

输入输出格式单一：直接调用 API 难以灵活适配多变的业务数据结构。
缺乏上下文管理：长对话或多轮交互中，上下文窗口限制和状态管理困难。
错误处理能力有限：网络波动或模型超时缺乏自动恢复机制。

复杂业务场景的挑战

多步骤处理需求：如先检索知识库，再总结，最后格式化输出。
数据清洗和转换：原始数据需经过预处理才能被模型有效理解。
结果验证和质量控制：生成内容需经过校验以确保准确性。

链式架构的优势

模块化设计：各组件职责分离，便于独立测试与维护。
灵活的扩展性：可轻松插入新的处理节点而不影响整体流程。
统一的错误处理：集中管理异常，提升系统鲁棒性。
可复用的组件：通用逻辑封装后可在多个项目中复用。

基础链式架构设计

1. 核心组件定义

采用面向对象设计，通过抽象基类定义标准接口，确保组件间的解耦。

from typing import Any, Dict, Optional, List
from abc import ABC, abstractmethod
import logging

# 配置日志
logger = logging.getLogger(__name__)

class BaseProcessor(ABC):
    """处理器基类，定义数据处理的标准接口"""
    @abstractmethod
    def process(self, data: Any) -> Any:
        """执行处理逻辑
        
        Args:
            data: 输入数据
            
        Returns:
            处理后的数据
        """
        pass

class BaseChain:
    """链式架构基类，编排各个处理组件"""
     ():
        .preprocessor: [BaseProcessor] = 
        .prompt_manager: [] = 
        .llm: [] = 
        .postprocessor: [BaseProcessor] = 
        .error_handler: [] = 

     () -> [, ]:
        
        :
            
             .preprocessor:
                processed_input = .preprocessor.process(input_data)
            :
                processed_input = input_data
            
            
            prompt = ._generate_prompt(processed_input)
            
            
            response = ._call_llm(prompt)
            
            
             .postprocessor:
                result = .postprocessor.process(response)
            :
                result = response
            
             result
         Exception  e:
            logger.error()
             .error_handler:
                 .error_handler.handle(e, input_data)
            

     () -> :
          .prompt_manager:
             ValueError()
         .prompt_manager.generate_prompt(, **data)

     () -> :
          .llm:
             ValueError()
         .llm.invoke(prompt)

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

class PreProcessor(BaseProcessor):
    def process(self, data: Dict[str, Any]) -> Dict[str, Any]:
        """数据预处理逻辑
        
        包括清洗、格式转换及有效性验证
        """
        cleaned_data = self._clean_data(data)
        formatted_data = self._format_data(cleaned_data)
        self._validate_data(formatted_data)
        return formatted_data

    def _clean_data(self, data: Dict[str, Any]) -> Dict[str, Any]:
        # 移除特殊字符，统一编码
        return {k: str(v).strip() for k, v in data.items()}

    def _format_data(self, data: Dict[str, Any]) -> Dict[str, Any]:
        # 转换为模型期望的键值对
        return {"input": data.get("query", "")}

    def _validate_data(self, data: Dict[str, Any]):
        if not data.get("input"):
            raise ValueError("Input cannot be empty")

class PostProcessor(BaseProcessor):
    def process(self, data: Dict[str, Any]) -> Dict[str, Any]:
        """结果后处理逻辑
        
        解析 JSON，格式化输出，质量检查
        """
        parsed_result = self._parse_result(data)
        formatted_result = self._format_output(parsed_result)
        self._quality_check(formatted_result)
        return formatted_result

    def _parse_result(self, raw_response: str) -> Dict[str, Any]:
        # 尝试解析为 JSON，失败则返回文本
        import json
        try:
            return json.loads(raw_response)
        except json.JSONDecodeError:
            return {"text": raw_response}

    def _format_output(self, parsed: Dict[str, Any]) -> str:
        return parsed.get("answer", parsed.get("text", ""))

    def _quality_check(self, output: str):
        # 检查是否包含敏感词或空内容
        if len(output) < 5:
            logger.warning("Output too short")

from typing import List

class PromptTemplate:
    def __init__(self, template: str, input_variables: List[str]):
        self.template = template
        self.input_variables = input_variables
        self.version = "1.0"

class PromptManager:
    def __init__(self):
        self.templates: Dict[str, PromptTemplate] = {}
        self.version_control = True

    def register_template(self, name: str, template: str, 
                         input_variables: List[str]) -> None:
        """注册提示词模板"""
        self.templates[name] = PromptTemplate(
            template=template,
            input_variables=input_variables
        )

    def generate_prompt(self, template_name: str, **kwargs) -> str:
        """生成提示词
        
        验证参数完整性并填充模板
        """
        template = self.templates.get(template_name)
        if not template:
            raise ValueError(f"Template {template_name} not found")
        
        self._validate_inputs(template, kwargs)
        return template.template.format(**kwargs)

    def _validate_inputs(self, template: PromptTemplate, inputs: Dict):
        missing = set(template.input_variables) - set(inputs.keys())
        if missing:
            raise ValueError(f"Missing variables: {missing}")

class PromptOptimizer:
    def __init__(self):
        self.few_shots: List[Dict[str, str]] = []
        self.context: Dict[str, Any] = {}

    def add_few_shot(self, example: Dict[str, str]) -> None:
        """添加少样本示例"""
        self.few_shots.append(example)

    def set_context(self, context: Dict[str, Any]) -> None:
        """设置上下文信息"""
        self.context.update(context)

    def optimize_prompt(self, base_prompt: str) -> str:
        """优化提示词
        
        1. 添加角色设定
        2. 注入上下文
        3. 添加思维链引导
        4. 添加少样本示例
        """
        # 1. 添加角色设定
        prompt = f"You are an expert assistant.\n{base_prompt}"
        
        # 2. 注入上下文
        if self.context:
            context_str = "\nContext:\n" + str(self.context)
            prompt += context_str
        
        # 3. 添加思维链引导
        prompt += "\nPlease think step by step before answering."
        
        # 4. 添加少样本示例
        if self.few_shots:
            examples = "\nExamples:\n" + "\n".join(
                [f"Q: {e['q']}\nA: {e['a']}" for e in self.few_shots]
            )
            prompt += examples
        
        return prompt

import time

class LLMChainError(Exception):
    """基础链错误"""
    pass

class ErrorHandler:
    def __init__(self):
        self.retry_strategy = RetryStrategy()
        self.fallback_handler = FallbackHandler()
        self.monitor = Monitor()

    def handle(self, error: Exception, original_input: Dict) -> Dict[str, Any]:
        """统一错误处理
        
        记录日志，判断重试，降级处理
        """
        try:
            # 1. 记录错误
            self.monitor.log_error(error, original_input)
            
            # 2. 判断是否可重试
            if self.is_retryable(error):
                return self.retry_strategy.retry(original_input)
            
            # 3. 降级处理
            return self.fallback_handler.handle(error, original_input)
        finally:
            # 4. 错误通知
            self.monitor.notify(error)

    def is_retryable(self, error: Exception) -> bool:
        # 仅网络错误或超时可重试
        return isinstance(error, (ConnectionError, TimeoutError))

class RetryStrategy:
    def __init__(self, max_retries: int = 3, 
                 base_delay: float = 1.0):
        self.max_retries = max_retries
        self.base_delay = base_delay
        self.current_retry = 0

    def retry(self, input_data: Dict) -> Dict[str, Any]:
        """实现指数退避重试
        
        带随机抖动以防止风暴
        """
        if self.current_retry >= self.max_retries:
            raise LLMChainError("Max retries exceeded")
        
        delay = self.base_delay * (2 ** self.current_retry)
        jitter = delay * 0.1  # 10% 抖动
        time.sleep(delay + jitter)
        
        self.current_retry += 1
        # 实际生产中应重新调用 chain.process(input_data)
        return {"status": "retrying", "attempt": self.current_retry}

class FallbackHandler:
    def handle(self, error: Exception, input_data: Dict) -> Dict[str, Any]:
        """降级处理，返回默认响应"""
        return {
            "status": "fallback",
            "message": "Service temporarily unavailable",
            "original_query": input_data.get("query", "")
        }

class Monitor:
    def log_error(self, error: Exception, data: Dict):
        print(f"Error logged: {error}")
    
    def notify(self, error: Exception):
        print(f"Alert sent for: {error}")

class QAChain(BaseChain):
    def __init__(self):
        super().__init__()
        self.setup_components()

    def setup_components(self):
        # 1. 设置预处理器
        self.preprocessor = QAPreProcessor()
        
        # 2. 配置提示词管理器
        self.prompt_manager = self._setup_prompt_manager()
        
        # 3. 配置 LLM (此处为模拟)
        self.llm = MockLLM()
        
        # 4. 设置后处理器
        self.postprocessor = QAPostProcessor()
        
        # 5. 配置错误处理
        self.error_handler = ErrorHandler()

    def _setup_prompt_manager(self):
        manager = PromptManager()
        manager.register_template(
            "qa_template",
            """
            作为一个智能问答助手，请回答以下问题：
            问题：{question}
            要求：
            1. 回答要简洁明了
            2. 如果不确定，请明确说明
            3. 如果需要更多信息，请指出具体需要什么信息
            """,
            ["question"]
        )
        return manager

class MockLLM:
    def invoke(self, prompt: str) -> str:
        # 模拟 LLM 响应
        return "{\"answer\": \"这是一个模拟的回答。\"}"

LLM 链式架构基础设计与实践

为什么需要链式架构？

基础链式架构设计

1. 核心组件定义

更多推荐文章

相关免费在线工具

2. 组件解耦设计

提示词工程基础

1. 提示词模板管理

2. 提示词优化策略

错误处理机制

1. 错误处理基础架构

实战案例：智能问答系统

安全与隐私保护

性能优化建议

测试策略

总结

更多推荐文章

相关免费在线工具

LLM 链式架构基础设计与实践

为什么需要链式架构？

基础链式架构设计

1. 核心组件定义

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2. 组件解耦设计

提示词工程基础

1. 提示词模板管理

2. 提示词优化策略

错误处理机制

1. 错误处理基础架构

实战案例：智能问答系统

安全与隐私保护

性能优化建议

测试策略

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具