企业级技术内核,复刻真实开发场景
智能体实训平台,深度复刻企业级智能知识检索系统的核心架构,采用 LangGraph 工作流引擎与 Agent 状态机模式,构建从查询改写、多知识库检索、相关性评估到网页爬取的自动化流程。学习者将直接接触 Python 3.12 开发环境、PostgreSQL 数据库存储、FastAPI 接口服务等主流技术栈,实操 langchain-openai、tavily-python 等核心工具库,同步企业真实开发标准。
核心技术实现文档全景呈现
一、开发环境与技术栈配置
| 类别 | 核心组件 | 实训教学价值 |
|---|---|---|
| 编程语言 | Python 3.12 | 掌握行业主流开发语言,适配 AI 项目开发需求 |
| 开发工具 | PyCharm、Anaconda/Conda、Git | 熟悉企业级开发协作工具链,提升开发效率 |
| 数据库 | PostgreSQL 12+、MaxKB | 理解对话历史持久化与企业知识库管理逻辑 |
| 运行环境 | Windows 10/11、Docker | 掌握本地开发测试与容器化部署全流程 |
| API 服务 | OpenAI API(qwen3-32b/qwen-flash)、Ollama、Tavily API | 实操大模型调用、本地 LLM 部署与智能搜索服务集成 |
| 核心框架 | LangGraph 1.0.5、LangChain 1.2.1、FastAPI 0.128.0 | 深入理解智能体工作流编排、LLM 调用与 API 服务开发 |
| 爬虫与网络 | tavily-python 0.7.17、curl-cffi 0.14.0、trafilatura 2.0.0、beautifulsoup4 4.14.2 | 掌握智能搜索、反爬策略与网页内容提取技术 |
| 辅助工具 | tiktoken 0.12.0、tenacity 9.1.2、pydantic 2.12.0 | 学习 Token 计数、重试机制与数据验证等开发必备技能 |
二、系统架构与核心机制
-
工作流设计(LangGraph 框架)采用状态机模式,完整流程为:用户输入 → 查询处理 → 查询改写 → 知识库检索 → 相关性评估 → (相关则生成答案,不相关则网页爬取后生成答案)。关键节点包含 process_query(状态初始化)、rewrite_query(指代消解)、search_knowledge_base(多库并行检索)、evaluate_relevance(相关性评估)、crawl_website(网页爬取)、generate_answer(答案生成),让学习者直观理解智能体的决策与执行逻辑。
-
状态管理(AgentState)继承 LangGraph 的 MessagesState,扩展核心业务字段,实训中可实操状态设计与数据流转:
class AgentState(MessagesState):
kb_results: list
is_relevant:
crawl_result:
context:
sources:
error:
rewritten_query:


