Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

Sim 是一个基于有向无环图（DAG）的低代码 AI 智能体工作流编排与执行引擎。它通过声明式建模将复杂流程抽象为节点与边，支持循环、并行及人工介入控制。核心组件包括高性能执行引擎、状态持久化恢复机制及多工具集成处理器（含 MCP 协议）。技术实现采用 TypeScript，解决了传统脚本硬编码耦合度高、状态管理困难及工具集成繁琐等问题，适用于自动化客服、数据分析等需要串联多个 AI 步骤的场景。

DevOpsTeam发布于 2026/4/10更新于 2026/7/1934 浏览

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

项目地址：https://github.com/simstudioai/sim

项目简介：Sim 是一个基于有向无环图（DAG）的、声明式的低代码/无代码 AI 智能体工作流编排与执行引擎。它并非一个简单的'可视化工具'，其核心是一个高性能、支持复杂流程控制（如循环、并行、暂停恢复）的运行时系统。代码展示了其核心执行引擎、DAG 构建器和智能体（Agent）处理器。

面临问题、场景与人群：

问题：
1. 编排复杂性：构建多步骤、具备条件判断、循环、并行及人工介入的 AI 应用逻辑复杂，传统代码编写工作量大，易出错。
2. 状态管理困难：AI 工作流执行时间长、可能中断（如等待人工审批），需要可靠的持久化与恢复机制。
3. 工具集成繁琐：需要将多种工具（API、函数、MCP 协议工具、自定义代码）统一封装，供 AI 智能体安全、便捷地调用。
4. 开发效率瓶颈：从原型到生产部署周期长，需要兼顾可视化设计和底层执行性能。
目标人群：AI 应用开发者、产品经理、业务分析师，以及需要在业务流程中集成 AI 能力的企业团队。
核心场景：自动化客服、内容生成流水线、数据分析与报告、复杂的决策支持系统等需要串联多个 AI 步骤和人工审核的流程。

解决方法与演进：

传统方式：开发人员使用脚本（如 Python）硬编码流程逻辑，耦合度高，状态管理需自行实现，可视化与执行引擎分离。
Sim 新方式：
- 声明式建模：将工作流抽象为 DAG，节点（Block）声明其功能，边（Edge）声明依赖关系。执行引擎负责解析 DAG 并调度。
- 可视化即代码：画布操作直接生成可序列化的 DAG 描述（SerializedWorkflow），设计与执行使用同一套数据模型。
- 内置复杂控制流：通过 LoopConstructor, ParallelConstructor 等将高级语义（循环、并行）编译为底层 DAG 结构。
- 执行快照与恢复：ExecutionEngine 支持将运行时状态（如 pendingBlocks, remainingEdges）序列化，实现'暂停/恢复'。

商业价值预估：

代码成本估算：构建一个具备类似 DAG 执行引擎、状态恢复、多工具集成能力的系统，需要一个 5-8 人的资深前端与后端团队约 9-12 个月，粗略人力成本在数百万人民币级别。
覆盖问题空间效益：Sim 通过提供标准化平台，将上述成本分摊给大量用户。它解决了 AI 应用开发中的'编排'、'集成'、'部署'三大核心痛点，覆盖了从原型验证到生产部署的全链路。其商业价值在于显著降低企业引入 AI 自动化的技术门槛和时间成本，潜在市场涵盖金融、教育、电商、客服等多个行业。其开源 + 托管模式，有助于快速建立生态，获取早期用户与场景反馈。

2. 详细功能拆解（产品 + 技术视角）

可视化 DAG 编辑器（产品层）
- 产品视角：用户通过拖拽 Block、连线来设计工作流，直观表达'先做什么，后做什么，在什么条件下分支'。
- 技术支撑：前端组件生成 SerializedWorkflow 数据。核心是后端的 DAGBuilder.build() 方法，它将用户友好的序列化数据，编译（Construction）为内部可执行的图结构，处理了循环展开、并行路径识别等复杂转换。

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

项目地址：https://github.com/simstudioai/sim

面临问题、场景与人群：

问题：
1. 编排复杂性：构建多步骤、具备条件判断、循环、并行及人工介入的 AI 应用逻辑复杂，传统代码编写工作量大，易出错。
2. 状态管理困难：AI 工作流执行时间长、可能中断（如等待人工审批），需要可靠的持久化与恢复机制。
3. 工具集成繁琐：需要将多种工具（API、函数、MCP 协议工具、自定义代码）统一封装，供 AI 智能体安全、便捷地调用。
4. 开发效率瓶颈：从原型到生产部署周期长，需要兼顾可视化设计和底层执行性能。
目标人群：AI 应用开发者、产品经理、业务分析师，以及需要在业务流程中集成 AI 能力的企业团队。
核心场景：自动化客服、内容生成流水线、数据分析与报告、复杂的决策支持系统等需要串联多个 AI 步骤和人工审核的流程。

解决方法与演进：

传统方式：开发人员使用脚本（如 Python）硬编码流程逻辑，耦合度高，状态管理需自行实现，可视化与执行引擎分离。
Sim 新方式：
- 声明式建模：将工作流抽象为 DAG，节点（Block）声明其功能，边（Edge）声明依赖关系。执行引擎负责解析 DAG 并调度。
- 可视化即代码：画布操作直接生成可序列化的 DAG 描述（SerializedWorkflow），设计与执行使用同一套数据模型。
- 内置复杂控制流：通过 LoopConstructor, ParallelConstructor 等将高级语义（循环、并行）编译为底层 DAG 结构。
- 执行快照与恢复：ExecutionEngine 支持将运行时状态（如 pendingBlocks, remainingEdges）序列化，实现'暂停/恢复'。

商业价值预估：

代码成本估算：构建一个具备类似 DAG 执行引擎、状态恢复、多工具集成能力的系统，需要一个 5-8 人的资深前端与后端团队约 9-12 个月，粗略人力成本在数百万人民币级别。
覆盖问题空间效益：Sim 通过提供标准化平台，将上述成本分摊给大量用户。它解决了 AI 应用开发中的'编排'、'集成'、'部署'三大核心痛点，覆盖了从原型验证到生产部署的全链路。其商业价值在于显著降低企业引入 AI 自动化的技术门槛和时间成本，潜在市场涵盖金融、教育、电商、客服等多个行业。其开源 + 托管模式，有助于快速建立生态，获取早期用户与场景反馈。

2. 详细功能拆解（产品 + 技术视角）

可视化 DAG 编辑器（产品层）
- 产品视角：用户通过拖拽 Block、连线来设计工作流，直观表达'先做什么，后做什么，在什么条件下分支'。
- 技术支撑：前端组件生成 SerializedWorkflow 数据。核心是后端的 DAGBuilder.build() 方法，它将用户友好的序列化数据，编译（Construction）为内部可执行的图结构，处理了循环展开、并行路径识别等复杂转换。

// apps/sim/executor/execution/engine.ts - 简化伪代码 export class ExecutionEngine { async run(triggerBlockId?: string): Promise<ExecutionResult> { const startTime = Date.now(); try { // 1. 队列初始化：可能从快照恢复，或从触发点/起点开始 this.initializeQueue(triggerBlockId); // 2. 主调度循环：只要有待处理工作就继续 while(this.hasWork()){ // 检查 readyQueue 或 executing await this.processQueue(); // 处理就绪节点，并等待任意一个执行完成 } // 3. 收尾：等待所有异步执行彻底结束 await this.waitForAllExecutions(); // 4. 构建成功结果 return { success: true, output: this.finalOutput, ...}; } catch(error) { // 5. 错误处理：包装错误信息，保留执行上下文 const executionResult: ExecutionResult = { success: false, ...}; if(error && typeof error === 'object'){ (error as any).executionResult = executionResult; // 将结果附加到原始错误上，便于调试 } throw error; // 重新抛出，由上层捕获 } } private async processQueue(): Promise<void> { // 批量执行所有当前就绪的节点（实现隐式并行） while(this.readyQueue.length > 0){ const nodeId = this.dequeue(); const promise = this.executeNodeAsync(nodeId); // 异步执行，不等待 this.trackExecution(promise); // 加入执行跟踪集合 } // 关键：等待至少一个正在执行的任务完成，以释放资源并可能产生新的就绪节点 if(this.executing.size > 0){ await this.waitForAnyExecution(); // 使用 Promise.race } } private async executeNodeAsync(nodeId: string): Promise<void> { const wasAlreadyExecuted = this.context.executedBlocks.has(nodeId); const result = await this.nodeOrchestrator.executeNode(this.context, nodeId); if(!wasAlreadyExecuted){ // 关键：节点完成后的回调，需要加锁（queueLock）确保状态更新原子性 await this.withQueueLock(async()=>{ await this.handleNodeCompletion(nodeId, result.output, result.isFinalOutput); }); } } private async handleNodeCompletion(nodeId: string, output: NormalizedBlockOutput, isFinalOutput: boolean): Promise<void> { const node = this.dag.nodes.get(nodeId); // 关键点 1: 检查暂停 if(output._pauseMetadata){ this.pausedBlocks.set(pauseMetadata.contextId, output._pauseMetadata); this.context.metadata.status = 'paused'; return; // 不再处理下游，工作流进入暂停状态 } // 关键点 2: 处理节点输出（如变量赋值） await this.nodeOrchestrator.handleNodeCompletion(this.context, nodeId, output); // 关键点 3: 边处理，激活下游 const readyNodes = this.edgeManager.processOutgoingEdges(node, output, false); this.addMultipleToQueue(readyNodes); // 下游节点进入就绪队列 // 关键点 4: 处理动态节点（如并行展开新增的节点） if(this.context.pendingDynamicNodes?.length > 0){ this.addMultipleToQueue(this.context.pendingDynamicNodes); this.context.pendingDynamicNodes = []; } } }

// apps/sim/executor/handlers/agent/agent-handler.ts - 节选 private async formatTools(ctx: ExecutionContext, inputTools: ToolInput[]): Promise<any[]> { // ... 过滤 usageControl 等 ... const mcpTools: ToolInput[] = []; const otherTools: ToolInput[] = []; // 1. 分类工具 for(const tool of filtered){ if(tool.type === 'mcp'){ mcpTools.push(tool); } else{ otherTools.push(tool); } } // 2. 并行处理非 MCP 工具（自定义工具、内置工具转换） const otherResults = await Promise.all(otherTools.map(async(tool)=>{ if(tool.type === 'custom-tool'){ return await this.createCustomTool(ctx, tool); // 创建可执行函数 } return this.transformBlockTool(ctx, tool); // 转换内置工具（如 API 块） })); // 3. 批量处理 MCP 工具（性能优化） const mcpResults = await this.processMcpToolsBatched(ctx, mcpTools); // 4. 合并并返回 return [...otherResults,...mcpResults].filter(tool => tool != null); } private async createCustomTool(ctx: ExecutionContext, tool: ToolInput): Promise<any> { // ... 获取 schema 和 code ... const toolId = `${AGENT.CUSTOM_TOOL_PREFIX}${title}`; return { id: toolId, name: schema.function.name, description: schema.function.description || '', parameters: filteredSchema, // 过滤掉已由 params 提供的参数 params: userProvidedParams, // 预设参数 usageControl: tool.usageControl || 'auto', // 关键：定义执行函数，在 LLM 调用时被执行 executeFunction: async(callParams: Record<string,any>)=>{ const mergedParams = mergeToolParameters(userProvidedParams, callParams); const result = await executeTool('function_execute', { code, // 用户定义的函数代码... mergedParams, timeout: tool.timeout, envVars: ctx.environmentVariables || {}, workflowVariables: ctx.workflowVariables || {}, }, false, false, ctx); if(!result.success){ throw new Error(result.error); } return result.output; } }; }

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

2. 详细功能拆解（产品 + 技术视角）

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

2. 详细功能拆解（产品 + 技术视角）

更多推荐文章

相关免费在线工具

3. 技术难点挖掘

4. 详细设计图

4.1 核心架构图 (Component Diagram)

4.2 核心链路序列图：工作流执行 (Sequence Diagram)

4.3 核心类图 (Class Diagram)

5. 核心函数解析

5.1 DAGBuilder.build() - DAG 编译核心

5.2 ExecutionEngine.run() - 执行调度核心

5.3 AgentBlockHandler 中的工具格式化

总结

更多推荐文章

相关免费在线工具

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

2. 详细功能拆解（产品 + 技术视角）

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

Sim 基于 DAG 的 AI 智能体工作流编排引擎技术解析

1. 整体介绍

概要说明

2. 详细功能拆解（产品 + 技术视角）

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

3. 技术难点挖掘

4. 详细设计图

4.1 核心架构图 (Component Diagram)

4.2 核心链路序列图：工作流执行 (Sequence Diagram)

4.3 核心类图 (Class Diagram)

5. 核心函数解析

5.1 DAGBuilder.build() - DAG 编译核心

5.2 ExecutionEngine.run() - 执行调度核心

5.3 AgentBlockHandler 中的工具格式化

总结

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具