构建'可长期运行、可审计、可复用'的智能体系统
采用状态机(LangGraph)+ 技能包(Skills)+ 执行层(Shell)的三层架构组合。
核心原则
- 工作流持久化(Survive):确保 Agent 在崩溃、重启后能断点续跑,而非从头开始(LangGraph Checkpoint)。
- 能力模块化(Compose):将庞大的系统拆解为 Skills(技能包),实现'按需加载',避免提示词膨胀。
- 执行确定性(Control):在金融/报关场景下,确保相同的输入产生完全一致的输出,防止模型'自由发挥'(Shell 工具 + 结构化输出)。
- 状态可回溯(Audit):满足深圳金融合规,能随时回放任意步骤的决策快照(State Snapshot)。
- 成本可控(Optimize):通过服务端压缩(Compaction)自动修剪噪音历史,而非粗暴截断。
P0 级:生存基石(防崩 & 防篡改)
目标:确保 Agent 不因重启而丢失进度,且不越权操作。
持久化 (Survive)
LangGraph Checkpointer:将状态(State)保存至 SQLite/Redis。中断/人工审核后通过 thread_id 从断点恢复,而非从头开始。
确定性 (Control)
OpenAI Shell 工具:将核心逻辑(如汇率计算)封装在 Shell 脚本中,Agent 只负责调用,不负责'思考'算术。避免模型产生幻觉,确保结果正确和一致。
P1 级:性能与复用(降本 & 解耦)
模块化 (Compose)
拆分为独立 skill,采用 SKILL.md 格式。Agent 只预加载技能'目录',触发时才加载完整内容。
成本优化 (Optimize)
服务端压缩 (Compaction):利用 OpenAI Responses API 的自动压缩功能,将冗长对话压缩为'关键决策摘要'。长流程会话中,自动丢弃无关寒暄,保留关键业务状态。
P2 级:风控(审计 & 回溯)
目标:满足留痕要求,支持问题复盘。
状态回溯 (Audit)
State Snapshot + DAG:在关键节点(如支付确认)保存完整的 State 快照,并记录 DAG 执行路径。复盘时,可精准回放'某任务节点在某时的审核决策过程'。
护栏强化
双层网络白名单:组织级白名单 + 请求级策略,配合 domain_secrets 隐藏真实 API Key。防止 Agent 访问非法外链。

