Agent 系统架构设计：持久化、模块化与风控实践

构建'可长期运行、可审计、可复用'的智能体系统

采用状态机（LangGraph）+ 技能包（Skills）+ 执行层（Shell）的三层架构组合。

核心原则

工作流持久化（Survive）：确保 Agent 在崩溃、重启后能断点续跑，而非从头开始（LangGraph Checkpoint）。
能力模块化（Compose）：将庞大的系统拆解为 Skills（技能包），实现'按需加载'，避免提示词膨胀。
执行确定性（Control）：在金融/报关场景下，确保相同的输入产生完全一致的输出，防止模型'自由发挥'（Shell 工具 + 结构化输出）。
状态可回溯（Audit）：满足深圳金融合规，能随时回放任意步骤的决策快照（State Snapshot）。
成本可控（Optimize）：通过服务端压缩（Compaction）自动修剪噪音历史，而非粗暴截断。

P0 级：生存基石（防崩 & 防篡改）

目标：确保 Agent 不因重启而丢失进度，且不越权操作。

持久化 (Survive)

LangGraph Checkpointer：将状态（State）保存至 SQLite/Redis。中断/人工审核后通过 thread_id 从断点恢复，而非从头开始。

确定性 (Control)

OpenAI Shell 工具：将核心逻辑（如汇率计算）封装在 Shell 脚本中，Agent 只负责调用，不负责'思考'算术。避免模型产生幻觉，确保结果正确和一致。

P1 级：性能与复用（降本 & 解耦）

模块化 (Compose)

拆分为独立 skill，采用 SKILL.md 格式。Agent 只预加载技能'目录'，触发时才加载完整内容。

成本优化 (Optimize)

服务端压缩 (Compaction)：利用 OpenAI Responses API 的自动压缩功能，将冗长对话压缩为'关键决策摘要'。长流程会话中，自动丢弃无关寒暄，保留关键业务状态。

P2 级：风控（审计 & 回溯）

目标：满足留痕要求，支持问题复盘。

状态回溯 (Audit)

State Snapshot + DAG：在关键节点（如支付确认）保存完整的 State 快照，并记录 DAG 执行路径。复盘时，可精准回放'某任务节点在某时的审核决策过程'。

护栏强化

双层网络白名单：组织级白名单 + 请求级策略，配合 domain_secrets 隐藏真实 API Key。防止 Agent 访问非法外链。

Agent 系统架构设计：持久化、模块化与风控实践

构建'可长期运行、可审计、可复用'的智能体系统

核心原则

P0 级：生存基石（防崩 & 防篡改）

持久化 (Survive)

确定性 (Control)

P1 级：性能与复用（降本 & 解耦）

模块化 (Compose)

成本优化 (Optimize)

P2 级：风控（审计 & 回溯）

状态回溯 (Audit)

护栏强化

更多推荐文章

相关免费在线工具

更多推荐文章

相关免费在线工具

Agent 系统架构设计：持久化、模块化与风控实践

构建'可长期运行、可审计、可复用'的智能体系统

核心原则

P0 级：生存基石（防崩 & 防篡改）

持久化 (Survive)

确定性 (Control)

P1 级：性能与复用（降本 & 解耦）

模块化 (Compose)

成本优化 (Optimize)

P2 级：风控（审计 & 回溯）

状态回溯 (Audit)

护栏强化

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具