配置钉钉龙虾OpenClaw机器人调用OpenMetadata

配置钉钉龙虾OpenClaw机器人调用OpenMetadata

目录

一、前言

在这里插入图片描述


先介绍下这四个工具/协议的定位与核心能力,本文将从零开始配置。

1️⃣钉钉(DingTalk)

阿里巴巴旗下的企业协作平台,2014年上线,是中国市场份额最大的企业即时通讯与办公套件之一。

核心能力包括:即时消息与视频会议、考勤打卡与审批流、企业通讯录、低代码应用搭建(宜搭)、以及近年来整合的 AI 助理功能。它更像一个"企业操作系统",把 HR、OA、协同文档、客户管理等功能整合在一个 App 里,主要面向中大型企业的内部运营。

2️⃣OpenClaw

OpenClaw 是一个开源、可自托管的个人 AI Agent 平台。可运行在你自己的笔记本上,连接你已有的聊天渠道(钉钉、飞书等平台)。
它不仅能聊天 ,更能执行任务:读写文件、处理邮件、运行代码、控制浏览器、调度工作流。
详见:https://zhuanlan.zhihu.com/p/2015027745743189513

3️⃣OpenMetadata

开源的统一元数据管理平台(类似 DataHub、Amundsen),专注解决企业数据治理的痛点。

它提供:数据资产目录(知道你有哪些表、API、仪表盘)、数据血缘追踪(知道数据从哪来、流向哪)、数据质量监控、数据所有权与标签管理,以及协作功能(让数据工程师和业务人员共同维护元数据)。目标是让企业真正"知道自己的数据",降低数据孤岛和治理混乱的风险。

4️⃣MCP(Model Context Protocol)

由 Anthropic 在 2024 年底提出并开源的标准协议,定义了 LLM(如 Claude)如何与外部工具、数据源进行标准化通信。

可以类比为 AI 领域的"USB-C"——在此之前,每个 AI 应用和工具的集成方式各自为政;MCP 提供了统一的接口规范,让 LLM 能以一致的方式调用文件系统、数据库、API、第三方服务等资源。开发者只需实现一次 MCP Server,就能被任何支持 MCP 的客户端(如 Claude、Cursor)调用,大幅降低集成成本。


二、安装OpenClaw

详见官方文档:https://docs.openclaw.ai/zh-CN/install

macOS/Linux 执行安装命令,更新也可执行此命令

curl-fsSL https://openclaw.ai/install.sh |bash

Windows 执行安装命令

iwr -useb https://openclaw.ai/install.ps1 | iex 

模型可以选Qwen,有免费额度,其它下一步就行,空格勾选,Enter下一步
安装后可以验证下

openclaw doctor # 检查配置问题 openclaw status # Gateway 网关状态 openclaw dashboard # 打开浏览器 UI

三、配置OpenClaw钉钉机器人

详见官方文档:https://open.dingtalk.com/document/dingstart/install-openclaw-locally

1️⃣安装钉钉插件

openclaw plugins install @dingtalk-real-ai/dingtalk-connector 

2️⃣在 OpenClaw 中添加钉钉配置
通过终端应用,在终端中输入执行 vim ~/.openclaw/openclaw.json 进入文件编辑:

{"channels":{"dingtalk-connector":{"clientId":"钉钉应用的Client Secret", // 必选:填入上方的 钉钉 Client ID "clientSecret":"钉钉应用的Client Secret", // 必选:填入上方的 Client Secret "gatewayToken":"Gateway 认证 token", // 必选:Gateway 认证 token, openclaw.json配置中 gateway.auth.token 的值 "gatewayPassword":"", // 可选:Gateway 认证 password(与 token 二选一) "sessionTimeout":1800000 // 可选:会话超时(ms),默认 30 分钟 }}, "gateway":{ // gateway通常是已有的节点,配置时注意把http部分追加到已有节点下 "auth":{"mode":"token", "token":"Gateway 认证 token" // 必选:一般是安装时默认就有 }, "http":{"endpoints":{"chatCompletions":{"enabled":true // 必选 }}}}}

clientId和clientSecret见 https://alidocs.dingtalk.com/i/nodes/kDnRL6jAJMdn7BG2TwPE6LP0VyMoPYe1
钉钉机器人发布后,钉钉上搜索你创建的机器人。

在这里插入图片描述


语音也可以

在这里插入图片描述

四、调用OpenMetadata MCP

设置中获取OpenMetadata JWT 令牌,在Bots/McpApplicationBot
把MCP接口地址和令牌给龙虾,直接让连接即可

在这里插入图片描述
 OpenMetadata MCP 接口列表 1. search_metadata - 搜索元数据 功能: 在 OpenMetadata 目录中搜索数据资产和业务术语 支持搜索: 表、仪表板、主题、管道等元数据实体 关键参数: query - 自然语言搜索查询 entityType - 按实体类型过滤 queryFilter - 高级 OpenSearch JSON 查询 size - 返回结果数量(最大50) fields - 额外字段(如列信息、查询等) 2. get_entity_details - 获取实体详情 功能: 获取特定实体的详细信息 参数: entityType - 实体类型 fqn - 完全限定名称 3. get_entity_lineage - 获取血缘关系 功能: 获取实体的上下游依赖关系 用途: 根因分析(上游)或影响分析(下游) 参数: entityType - 实体类型 fqn - 完全限定名称 upstreamDepth - 上游遍历深度(默认3,最大10) downstreamDepth - 下游遍历深度(默认3,最大10) 4. create_glossary_term - 创建术语表术语 功能: 创建新的术语表术语 要求: 术语必须属于某个术语表 参数: glossary - 术语表完全限定名称 parentTerm - 父术语(可选) name - 术语名称 description - 术语描述 owners - 所有者列表 5. create_glossary - 创建术语表 功能: 创建新的术语表 参数: name - 术语表名称 description - 术语表描述 owners - 所有者列表 reviewers - 评审者列表 mutuallyExclusive - 术语是否互斥 6. patch_entity - 修补实体 功能: 基于 JSONPatch 修补实体 参数: entityType - 实体类型 fqn - 完全限定名称 patch - JSONPatch 字符串  接口分类 查询类接口 search_metadata - 搜索 get_entity_details - 详情 get_entity_lineage - 血缘 创建类接口 create_glossary - 创建术语表 create_glossary_term - 创建术语 更新类接口 patch_entity - 修补实体  使用场景 数据发现 search_metadata - 查找表、仪表板等 get_entity_details - 查看表结构、描述等 数据血缘分析 get_entity_lineage - 分析数据流向和依赖 数据治理 create_glossary - 创建业务术语表 create_glossary_term - 定义业务术语 patch_entity - 更新元数据信息  注意事项 搜索限制:size 参数最大为50,需要分页时使用 from 参数 血缘深度: 上游/下游深度最大为10,防止响应过大 术语表: 创建术语前需要先创建或选择术语表 权限: 需要有效的 Bearer Token 认证 
在这里插入图片描述


下面的操作有点吓人了,感觉真要被AI替代了!!!
我让统计一个提单量,本意是让它输出计算的SQL,它直接输出了统计报告,而且自动下载了pg客户端,还破解了数据库密码,自动执行。

在这里插入图片描述


家人们,我们失业了干啥呢😭

Read more

Pi0模型微调入门教程:基于LoRA在自有机器人数据上进行动作策略适配

Pi0模型微调入门教程:基于LoRA在自有机器人数据上进行动作策略适配 重要提示:本文介绍的Pi0模型微调方法主要适用于研究和开发环境,在实际机器人部署前请充分测试验证安全性。 1. 教程概述 1.1 学习目标 本教程将带你从零开始,学习如何使用LoRA(Low-Rank Adaptation)技术对Pi0机器人控制模型进行微调。学完本教程后,你将能够: * 理解Pi0模型的基本架构和微调原理 * 准备自己的机器人数据集并处理成合适格式 * 使用LoRA方法高效微调Pi0模型 * 评估微调后的模型性能并部署使用 1.2 前置知识要求 为了更好理解本教程,建议具备以下基础知识: * Python编程基础(能看懂简单代码) * 了解机器学习基本概念(训练、验证、测试) * 有过PyTorch或类似框架的使用经验更佳 * 对机器人控制有基本了解(非必须,但有帮助) 1.3 为什么选择LoRA微调 LoRA是一种参数高效的微调方法,相比全参数微调有三大优势: 1. 训练速度快:只需要训练少量参数,大大缩短训练时间 2. 内存占用少:可以在消费级GPU

用ms-swift做AI绘画理解?多模态微调就这么简单

用ms-swift做AI绘画理解?多模态微调就这么简单 你有没有试过让大模型看懂一张画?不是简单识别“这是猫”,而是真正理解画面里光影的流动、构图的张力、风格的情绪表达——甚至能根据描述精准修改细节。过去这需要复杂的视觉编码器+语言解码器联合训练,调参像在迷宫里找出口。但现在,用ms-swift,一个多模态微调框架,你可能只需要一条命令、一个数据集、不到一小时,就能让Qwen2.5-VL这样的模型学会“看画说话”。 这不是概念演示,而是真实可复现的工程实践。本文不讲抽象架构,不堆技术参数,就带你从零开始,用最贴近实际工作流的方式,完成一次完整的AI绘画理解能力微调:准备数据、启动训练、验证效果、部署推理。全程聚焦“怎么做”,所有操作都在单卡3090上实测通过,代码可直接复制运行。 1. 为什么是ms-swift?它到底解决了什么痛点 在动手之前,先说清楚:为什么不用HuggingFace Transformers自己搭?为什么不用Llama-Factory?ms-swift的不可替代性,藏在三个被多数教程忽略的现实细节里。 1.1 多模态数据格式,从来不是“

FPGA新手必看:Libero SoC 2024.2从安装到第一个工程实战(附免费License申请攻略)

FPGA开发入门:Libero SoC 2024.2从零到第一个工程实战指南 1. 环境准备与安装配置 对于FPGA开发新手来说,环境搭建往往是第一个拦路虎。Libero SoC作为Microchip旗下功能全面的FPGA开发工具链,其2024.2版本在用户体验上做了不少优化。我们先从最基础的安装开始,确保开发环境正确配置。 系统要求检查: * 操作系统:Windows 10/11 64位专业版或企业版 * 内存:建议16GB以上(最低8GB) * 磁盘空间:安装目录需要至少20GB可用空间 * 显卡:支持OpenGL 3.3及以上 安装前建议关闭杀毒软件和防火墙,避免安装过程中出现权限问题。下载安装包时有两个选择: 安装类型特点适用场景Web Install按需下载组件,节省初始下载时间网络环境较好的开发者Full Install包含所有组件,离线安装更方便网络受限或需要多次安装 推荐使用Web Install方式,虽然首次运行需要联网,但可以确保获取最新组件。安装过程中有几个关键点需要注意: 1. 公共目录设置: 这个目录用于存放IP核等共享资源

基于强化学习Q-learning算法的无人机三维路径规划算法原理与实现,MATLAB代码

基于强化学习Q-learning算法的无人机三维路径规划算法原理与实现,MATLAB代码

一、算法概述 本文基于Q-learning离线强化学习,实现三维栅格环境下无人机无碰撞、最短路径、最少步数路径规划。无人机具备1格/2格三维全向移动、对角线飞行、悬停能力,通过与环境交互迭代学习最优策略,以到达终点、路径距离、移动步数、避障为核心目标,输出满足约束的最优飞行路径。 二、环境与核心建模 1. 三维状态空间 将无人机飞行空间离散化为三维栅格地图,状态定义为无人机坐标: S={(x,y,z)∣1≤x≤Xmax, 1≤y≤Ymax, 1≤z≤Zmax} S = \left\{ (x,y,z) \mid 1 \le x \le X_{max},\ 1 \le y