阿里云的moltbot机器人使用钉钉的Stream流式接入

优质文章学习记录

09 Apr 2026 — 1 min read

注意

这个不需要工作流
这个不需要开放外网

具体方法：

1.check代码https://github.com/DingTalk-Real-AI/dingtalk-moltbot-connector

2.package.json增加如下代码

"moltbot": { "extensions": ["./plugin.ts"], "channels": ["dingtalk-connector"], "installDependencies": true }

3.安装插件

moltbot plugins install dingtalk-moltbot-connector

4.增加钉钉配置~/.moltbot/moltbot.json；如果有了进行提花

{ "channels": { "dingtalk-connector": { "enabled": true, "clientId": "dingxxxxxxxxx", // 钉钉 AppKey "clientSecret": "your_secret_here", // 钉钉 AppSecret "gatewayToken": "", // 可选：Gateway 认证 token, opencode.json配置中 gateway.auth.token 的值 "gatewayPassword": "", // 可选：Gateway 认证 password（与 token 二选一） "sessionTimeout": 1800000 // 可选：会话超时(ms)，默认 30 分钟 } }, "gateway": { // gateway通常是已有的节点，配置时注意把http部分追加到已有节点下 "http": { "endpoints": { "chatCompletions": { "enabled": true } } } } }

4.重启gateway

moltbot gateway restart

5.登录钉钉开发平台修改机器人配置

切换成stream，关闭工作流

Read more

SmolVLA实操手册：基于lerobot/smolvla_base的机器人动作预测全流程

SmolVLA实操手册：基于lerobot/smolvla_base的机器人动作预测全流程想让机器人听懂你的话，看懂周围环境，然后自己动起来吗？听起来像是科幻电影里的场景，但现在，一个叫SmolVLA的模型就能帮你实现。它就像一个给机器人装上的“大脑”，让机器人能看、能听、能思考，最后还能执行动作。你可能觉得这种技术一定很复杂，需要昂贵的硬件和深奥的编程。但SmolVLA恰恰相反，它被设计得小巧高效，专门为了让机器人技术变得更亲民、更容易上手。今天，我们就来手把手教你，如何从零开始，玩转这个基于lerobot/smolvla_base模型的机器人动作预测系统。 1. 从零开始：快速部署你的机器人“大脑” 别被“模型部署”这个词吓到，整个过程比你想象的要简单得多。我们假设你已经在一个支持Python和GPU的环境里（比如一台有NVIDIA显卡的电脑或云服务器），接下来只需要几步。 1.1 环境准备：打好基础首先，确保你的电脑环境已经就绪。SmolVLA需要一些基本的Python库来运行。打开你的终端或命令行工具，我们一步步来。最核心的是安装LeRobot框架，这是

当AI成为“家人”：心伴机器人如何重塑老年居家康养新模式

当AI成为“家人”：心伴机器人如何重塑老年居家康养新模式

——一位老年心理学专家的深度观察与实践指南引言：孤独的晚年，科技能否给出答案？ 2024年，中国60岁及以上人口突破3.1亿，占总人口22%。这意味着每5个中国人中，就有1位老人。更令人揪心的是，其中近1.2亿是独居或空巢老人。他们独自面对日升日落，独自承受身体的不适，独自吞咽无人对话的寂寞。民政部《2023中国老龄产业发展报告》披露了两组扎心的数据：76%的长者因“操作太难”放弃智能设备；82%的子女担忧“紧急求助响应延迟”。一边是技术的飞速发展，一边是长者被技术抛弃的无奈；一边是子女的牵挂，一边是父母“我很好”的隐瞒。科技的温度，究竟该如何照见人心？在深度参与3000+长者访谈和多个康养项目调研后，我看到了一款名为“心伴”的AI陪伴机器人。它没有炫技式的功能堆砌，而是以“朴实赋能”为核心理念，试图让AI成为长者身边“会说话的家人”。今天，我想从老年心理学和家庭关系的视角，深度剖析这一项目如何为老年居家康养开辟新路径。一、问题分析：

Dify平台接入Sonic数字人，打造低代码AI应用

Dify平台接入Sonic数字人，打造低代码AI应用在短视频内容爆炸式增长的今天，越来越多企业与个人面临一个共同挑战：如何以极低成本、极高效率生产高质量的讲解类视频？真人出镜受限于时间、形象和表达能力；传统虚拟数字人又依赖复杂的3D建模与动画团队，动辄数万元投入让人望而却步。直到像 Sonic 这样的轻量级口型同步模型出现，局面才真正开始改变。它让“一张照片+一段录音=会说话的数字人”成为现实。更进一步的是，当这类前沿AI能力被封装进 Dify 这样的低代码平台后，普通用户甚至无需懂编程，也能在几分钟内构建属于自己的数字人生成系统。这不仅是技术的突破，更是创作民主化的里程碑。 Sonic：从听觉到视觉的精准映射 Sonic由腾讯联合浙江大学研发，是一款专注于“音频驱动人脸动画”的端到端深度学习模型。它的核心任务很明确：给定一张静态人像和一段语音，输出一段嘴型与声音完全同步、表情自然流畅的说话视频。与传统方案不同，Sonic不依赖任何3D建模或动作捕捉数据。它直接通过神经网络学习音素与面部肌肉运动之间的隐式关系，在2D图像空间中逐帧生成动态画面。整个过程更像是“让照

Stable Diffusion的3个替代方案

Stable Diffusion的3个替代方案

Stable Diffusion 虽然不再像2022-2023年那样热门，但仍然是最重要的开源权重图像模型之一。它允许用户使用自己的自定义数据集对模型进行微调，从而获得对相似度、艺术风格或特定角色细节的精确控制。但这需要一定的模型训练知识，设置和微调过程并不简单，训练时间也取决于训练数据的大小。 1、PixAI PixAI 是一个专门针对动漫风格和高度风格化数字艺术作品进行优化的AI图像生成平台。平台提供数百个社区微调模型和一套强大的工具，帮助你轻松将创意想法转化为现实。平台专为动漫主题视觉而设计，既作为创作工具，也作为社交网络，允许你从头创作新作品或"混音"其他社区成员生成的图像。最有趣的是能够轻松训练自己的 LoRA (Low-Rank Adaptation)。过去这是一项复杂的任务，现在只需上传训练图像，分配触发名称，等待平台烘焙自定义图像模型即可。使用现有的风格化模型，只需简单的提示词就能实现精美的动漫风格图像，无需明确告诉AI需要特定的风格、色调、着色等。 2、ChatGPT ChatGPT 是目前最受欢迎的通用聊天应用，其图像生成功能由 GPT-Im