【愚公系列】《扣子开发 AI Agent 智能体应用》011-扣子工作流详解(工作流逻辑结构和常见节点)

【愚公系列】《扣子开发 AI Agent 智能体应用》011-扣子工作流详解(工作流逻辑结构和常见节点)

💎【行业认证·权威头衔】
✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家
✔ 开发者社区全满贯:ZEEKLOG博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主
✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】
🎖 连续三年蝉联"华为云十佳博主"(2022-2024)
🎖 双冠加冕ZEEKLOG"年度博客之星TOP2"(2022&2023)
🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】
覆盖全栈技术矩阵:
◾ 编程语言:.NET/Java/Python/Go/Node…
◾ 移动生态:HarmonyOS/iOS/Android/小程序
◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙
◾ 游戏开发:Unity3D引擎深度解析

文章目录


🚀前言

工作流是指一系列相互关联的步骤或任务,用于完成特定的业务过程或项目。它定义了任务的顺序、执行者以及相关的条件和规则,以确保流程的顺利进行和最终目标的达成。本章将介绍扣子工作流的分类、解决的问题、逻辑结构、常见节点,并结合一个图文示例演示扣子工作流的用法。

🚀一、工作流逻辑结构和常见节点

🔎1.扣子工作流的逻辑结构

简单来说,扣子工作流是一个有唯一输入和唯一输出的有向无环图(DAG)。其核心构成是一系列按顺序连接的功能节点,如图所示。

在这里插入图片描述
  • 节点:是工作流中具有特定功能的独立模块,代表一个独立的步骤或逻辑。每个节点都负责处理数据、执行任务,并具备明确的输入和输出接口。
  • 固定节点:每个工作流都必须且唯一地包含一个开始节点和一个结束节点
    • 开始节点:定义工作流的输入参数,是流程的起点。它默认包含一个 input 参数,用于接收用户的原始输入。
    • 结束节点:定义工作流的输出结果,是流程的终点。它支持以返回变量或返回文本两种方式输出结果。
  • 节点连接:通过将一个节点的输出,引用为另一个节点的输入,可以将不同的节点像链条一样连接起来,形成数据流动和处理的操作链。例如,大模型节点的输出可以作为代码节点的输入进行进一步加工。
  • 设计哲学:构建工作流就像“搭积木”。将一个复杂任务分解为多个子任务,每个子任务由一个节点(积木)完成,再通过数据流(连接方式)将这些节点有序组合,最终形成一个完整的功能(形状)。

🔎2.扣子工作流的常见节点

节点是构建工作流的基础单元。扣子平台提供了丰富类型的节点,每个都有其特定的功能和适用场景。了解这些节点是高效搭建工作流的前提。主要节点类型概览如图所示。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

🦋2.1 插件节点

  • 功能:在工作流中调用已集成的插件工具,实现特定功能。

作用与场景:快速扩展工作流能力边界。当需要联网搜索、查询天气、处理图片等现有插件已提供的功能时,直接使用插件节点可以极大节省开发时间。如果官方插件无法满足需求,开发者还可以创建自定义插件接入。

在这里插入图片描述

🦋2.2 大模型节点

  • 功能:调用选定的大语言模型(LLM),根据输入和提示词生成文本输出。

作用与场景:为工作流注入“智能”,处理需要理解、生成、总结或推理自然语言的任务。其输出质量高度依赖所选模型的能力。基础版账号可使用有限的模型,而专业版账号可以接入如DeepSeek、火山方舟平台上的豆包系列等更多高性能模型。通过配置系统提示词和用户提示词,可以精准控制模型的角色与回复风格。

在这里插入图片描述

🦋2.3 代码节点

  • 功能:执行一段自定义的Python或JavaScript代码。

作用与场景:实现现有节点无法提供的特定逻辑、复杂算法、数据格式转换,或与外部API/系统进行集成。当工作流需要精确计算、复杂数据处理或调用特殊库时,代码节点提供了最高的灵活性。

在这里插入图片描述

🦋2.4 知识库检索节点

  • 功能:根据查询条件(Query),从指定的知识库中召回最匹配的文本片段。

作用与场景:为工作流提供精准的企业内部或垂直领域知识支持,有效解决大模型在专业问题上可能存在的“幻觉”或知识陈旧问题。广泛应用于智能问答、企业知识检索、智能客服等系统。

在这里插入图片描述

🦋2.5 图像生成节点

  • 功能:根据文本描述(或参考图)生成相关图片。

作用与场景:实现“文生图”或“图生图”。相较于通过对话调试图像生成参数,在工作流中使用此节点可以标准化、批量化地生产图片,大幅提升效率和效果一致性。

在这里插入图片描述

🦋2.6 循环节点

  • 功能:重复执行其内部的一系列节点。
  • 作用与场景:处理需要批量、迭代完成的任务。支持三种循环类型:
    1. 遍历数组:对数组中的每个元素执行相同操作。
    2. 指定次数:固定循环N次。

无限循环:需搭配终止条件使用。
典型应用:长文本分段落生成/总结、批量生成图片等。

在这里插入图片描述

🦋2.7 选择器节点

  • 功能:根据输入条件判断,引导工作流执行不同的分支路径(类似编程中的 if-else 语句)。
  • 作用与场景:实现工作流的条件分支逻辑。例如,在客服系统中,根据用户输入是“退货”还是“换货”,将流程导向不同的处理分支。适用于任务分发、流程切换和数据筛选等场景。

🦋2.8 文本处理节点

  • 功能:对输入的文本进行加工,如拼接、分隔、清洗、格式化等。

作用与场景:清洗和规整杂乱文本数据,提取关键信息,或将多个信息源组合成符合下游节点要求的输入格式。是优化数据流、提升后续节点处理准确性的重要工具。

在这里插入图片描述

🦋2.9 意图识别节点

  • 功能:基于大模型能力,理解用户输入的自然语言背后真正的意图(如“咨询”、“投诉”、“购买”),并将其分类。

作用与场景:在多功能智能体中作为“总调度”,对用户问题进行初步分类,然后流转到对应的专业分支(如不同知识库或处理流程)进行处理。它比纯规则的选择器节点更智能,能理解语义相近的不同表达。

在这里插入图片描述

🦋2.10 变量赋值节点

  • 功能:在工作流中创建或修改变量的值,实现数据的动态存储和传递。

作用与场景:临时存储用户输入的关键信息(如姓名、偏好)、中间计算结果或条件判断结果,供工作流后续的节点使用,是实现复杂状态管理和个性化服务的基础。

在这里插入图片描述

🦋2.11 数据库节点

  • 功能:对数据库进行增、删、改、查(CRUD)操作。可将用户的自然语言查询自动或半自动转换为SQL语句执行。

作用与场景:持久化存储用户信息、业务数据(如订单、用户资料),并提供强大的数据查询和管理能力,使智能体具备“记忆”和深度数据处理能力。

在这里插入图片描述

🦋2.12 画板节点

  • 功能:一个可视化图形编辑工具,支持插入图片、文本、形状等元素进行自由排版设计。

作用与场景:自动生成电商海报、营销Banner、社交媒体配图等。可以结合上游节点提供的文本和图片素材,动态生成符合设计规范的图片,实现内容与设计的自动化结合。

在这里插入图片描述

🦋2.13 长期记忆节点

  • 功能:从智能体的“长期记忆”中召回关于当前用户的个性化信息(如喜好、历史对话摘要)。

作用与场景:实现高度个性化的服务。例如,在新闻推荐工作流中,根据长期记忆中记录的用户兴趣偏好来筛选新闻内容,使推荐结果更贴合用户。

在这里插入图片描述

🦋2.14 工作流节点

  • 功能:在当前工作流中调用另一个已创建的工作流,实现工作流的嵌套。

作用与场景:实现复杂任务的模块化开发。将通用的、标准化的功能封装为子工作流,然后在主工作流中像调用函数一样复用,使整体逻辑更清晰,易于管理和维护。

在这里插入图片描述

🦋2.15 知识库写入节点

  • 功能:允许用户或工作流主动向指定的知识库上传并存储新的文档。

作用与场景:动态扩展和更新知识库内容。是构建用户可贡献内容的UGC系统、或让智能体在运行中积累新知识的唯一途径。注意:此节点为异步操作,且上传的文档对所有用户可见。

在这里插入图片描述

Read more

爆火AI圈的OpenClaw(小龙虾):能干活的本地AI智能体,一文吃透入门到实战

爆火AI圈的OpenClaw(小龙虾):能干活的本地AI智能体,一文吃透入门到实战

🔥个人主页:Cx330🌸 ❄️个人专栏:《C语言》《LeetCode刷题集》《数据结构-初阶》《C++知识分享》 《优选算法指南-必刷经典100题》《Linux操作系统》:从入门到入魔 《Git深度解析》:版本管理实战全解 🌟心向往之行必能至 🎥Cx330🌸的简介: 目录 前言: 一、先搞懂:OpenClaw到底是什么?为什么这么火? 1.1 项目核心定位 1.2 爆火的核心原因:踩中AI落地痛点 1.3 OpenClaw vs 传统AI vs 自动化工具 二、OpenClaw核心架构:它是怎么干活的? 三、保姆级部署:全平台一键安装,小白也能搞定 3.1 部署前置准备 3.2 官方一键脚本(新手首选,

【高级玩法】OpenClaw 多会话管理与子代理:让 AI 团队为你打工

【高级玩法】OpenClaw 多会话管理与子代理:让 AI 团队为你打工

目录 前言:一个不够用?那就来一队! 一、什么是多会话? 1.1 会话的概念 1.2 为什么需要多会话? 1.3 会话类型 二、会话管理基础 2.1 查看会话列表 2.2 创建新会话 2.3 切换到指定会话 2.4 查看会话状态 2.5 结束会话 三、子代理(Sub-agents)详解 3.1 什么是子代理? 3.2 子代理的工作流程 3.3 什么时候用子代理? 3.4 创建子代理 3.5

Flutter 组件 google_generative_language_api 适配鸿蒙 HarmonyOS 实战:生成式 AI 集成,构建大语言模型调度与全场景智能推理治理架构

Flutter 组件 google_generative_language_api 适配鸿蒙 HarmonyOS 实战:生成式 AI 集成,构建大语言模型调度与全场景智能推理治理架构

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 组件 google_generative_language_api 适配鸿蒙 HarmonyOS 实战:生成式 AI 集成,构建大语言模型调度与全场景智能推理治理架构 前言 在鸿蒙(OpenHarmony)生态迈向全场景 AI 赋能、涉及高效的语义理解、自动化内容生成及严苛的端云协同智能隐私保护背景下,如何实现一套既能深度对接 Google 生成式语言模型(如 Gemini、PaLM)、又能保障异步请求高响应性且具备多模态输入处理能力的“AI 调度中枢”,已成为决定应用智能化水平与用户体验代差的关键。在鸿蒙设备这类强调分布式协同与端侧算力按需分配的环境下,如果应用依然采用低效的 REST 手写拼接,由于由于 payload 结构复杂性,极易由于由于“协议解析异常”导致鸿蒙应用在大模型推理环节发生由于由于由于由于通讯阻塞。 我们需要一种能够统一模型调用语义、支持流式(Streaming)响应且符合鸿蒙异步异步并发范式的

OpenClaw 实战:让 AI 拥有“眼睛“——摄像头访问完全指南

OpenClaw 实战:让 AI 拥有“眼睛“——摄像头访问完全指南

今天冒出个想法,想让openclaw能控制摄像头分析图片。原因是我有本书,网上还没有电子版,想让openclaw分析然后把重点内容讲给我听。 📖让运行在 WSL2 里的 OpenClaw AI 助手能够"看见"摄像头画面。 🚧 探索过程 第一阶段:OpenClaw Node 配对(失败)折腾了 3 小时+,最终因为 WSL2 网络隔离问题放弃。 我在wsl里安了openclaw,他说要控制摄像头,必须在windows上安装node.js,安装npm,折腾了好久,就是报错。结论就是windows和wsl就是隔离的。 具体过程: **安装 Node.js:** 最开始下载了绿色版 Node.js(v24.14.0),遇到了一系列问题: ```powershell # 绿色版 Node.js