阿里云的moltbot机器人使用钉钉的Stream流式接入

注意

  1. 这个不需要工作流
  2. 这个不需要开放外网

具体方法:

1.check代码https://github.com/DingTalk-Real-AI/dingtalk-moltbot-connector

2.package.json增加如下代码

"moltbot": { "extensions": ["./plugin.ts"], "channels": ["dingtalk-connector"], "installDependencies": true }

3.安装插件

moltbot plugins install dingtalk-moltbot-connector

4.增加钉钉配置~/.moltbot/moltbot.json;如果有了进行提花

{ "channels": { "dingtalk-connector": { "enabled": true, "clientId": "dingxxxxxxxxx", // 钉钉 AppKey "clientSecret": "your_secret_here", // 钉钉 AppSecret "gatewayToken": "", // 可选:Gateway 认证 token, opencode.json配置中 gateway.auth.token 的值 "gatewayPassword": "", // 可选:Gateway 认证 password(与 token 二选一) "sessionTimeout": 1800000 // 可选:会话超时(ms),默认 30 分钟 } }, "gateway": { // gateway通常是已有的节点,配置时注意把http部分追加到已有节点下 "http": { "endpoints": { "chatCompletions": { "enabled": true } } } } }

4.重启gateway

moltbot gateway restart

5.登录钉钉开发平台修改机器人配置

   切换成stream,关闭工作流

Read more

SmolVLA实操手册:基于lerobot/smolvla_base的机器人动作预测全流程

SmolVLA实操手册:基于lerobot/smolvla_base的机器人动作预测全流程 想让机器人听懂你的话,看懂周围环境,然后自己动起来吗?听起来像是科幻电影里的场景,但现在,一个叫SmolVLA的模型就能帮你实现。它就像一个给机器人装上的“大脑”,让机器人能看、能听、能思考,最后还能执行动作。 你可能觉得这种技术一定很复杂,需要昂贵的硬件和深奥的编程。但SmolVLA恰恰相反,它被设计得小巧高效,专门为了让机器人技术变得更亲民、更容易上手。今天,我们就来手把手教你,如何从零开始,玩转这个基于lerobot/smolvla_base模型的机器人动作预测系统。 1. 从零开始:快速部署你的机器人“大脑” 别被“模型部署”这个词吓到,整个过程比你想象的要简单得多。我们假设你已经在一个支持Python和GPU的环境里(比如一台有NVIDIA显卡的电脑或云服务器),接下来只需要几步。 1.1 环境准备:打好基础 首先,确保你的电脑环境已经就绪。SmolVLA需要一些基本的Python库来运行。打开你的终端或命令行工具,我们一步步来。 最核心的是安装LeRobot框架,这是

当AI成为“家人”:心伴机器人如何重塑老年居家康养新模式

当AI成为“家人”:心伴机器人如何重塑老年居家康养新模式

——一位老年心理学专家的深度观察与实践指南 引言:孤独的晚年,科技能否给出答案? 2024年,中国60岁及以上人口突破3.1亿,占总人口22%。这意味着每5个中国人中,就有1位老人。更令人揪心的是,其中近1.2亿是独居或空巢老人。他们独自面对日升日落,独自承受身体的不适,独自吞咽无人对话的寂寞。 民政部《2023中国老龄产业发展报告》披露了两组扎心的数据:76%的长者因“操作太难”放弃智能设备;82%的子女担忧“紧急求助响应延迟”。一边是技术的飞速发展,一边是长者被技术抛弃的无奈;一边是子女的牵挂,一边是父母“我很好”的隐瞒。 科技的温度,究竟该如何照见人心? 在深度参与3000+长者访谈和多个康养项目调研后,我看到了一款名为“心伴”的AI陪伴机器人。它没有炫技式的功能堆砌,而是以“朴实赋能”为核心理念,试图让AI成为长者身边“会说话的家人”。今天,我想从老年心理学和家庭关系的视角,深度剖析这一项目如何为老年居家康养开辟新路径。 一、问题分析:

Dify平台接入Sonic数字人,打造低代码AI应用

Dify平台接入Sonic数字人,打造低代码AI应用 在短视频内容爆炸式增长的今天,越来越多企业与个人面临一个共同挑战:如何以极低成本、极高效率生产高质量的讲解类视频?真人出镜受限于时间、形象和表达能力;传统虚拟数字人又依赖复杂的3D建模与动画团队,动辄数万元投入让人望而却步。 直到像 Sonic 这样的轻量级口型同步模型出现,局面才真正开始改变。它让“一张照片+一段录音=会说话的数字人”成为现实。更进一步的是,当这类前沿AI能力被封装进 Dify 这样的低代码平台后,普通用户甚至无需懂编程,也能在几分钟内构建属于自己的数字人生成系统。 这不仅是技术的突破,更是创作民主化的里程碑。 Sonic:从听觉到视觉的精准映射 Sonic由腾讯联合浙江大学研发,是一款专注于“音频驱动人脸动画”的端到端深度学习模型。它的核心任务很明确:给定一张静态人像和一段语音,输出一段嘴型与声音完全同步、表情自然流畅的说话视频。 与传统方案不同,Sonic不依赖任何3D建模或动作捕捉数据。它直接通过神经网络学习音素与面部肌肉运动之间的隐式关系,在2D图像空间中逐帧生成动态画面。整个过程更像是“让照

Stable Diffusion的3个替代方案

Stable Diffusion的3个替代方案

Stable Diffusion 虽然不再像2022-2023年那样热门,但仍然是最重要的开源权重图像模型之一。它允许用户使用自己的自定义数据集对模型进行微调,从而获得对相似度、艺术风格或特定角色细节的精确控制。但这需要一定的模型训练知识,设置和微调过程并不简单,训练时间也取决于训练数据的大小。 1、PixAI PixAI 是一个专门针对动漫风格和高度风格化数字艺术作品进行优化的AI图像生成平台。平台提供数百个社区微调模型和一套强大的工具,帮助你轻松将创意想法转化为现实。 平台专为动漫主题视觉而设计,既作为创作工具,也作为社交网络,允许你从头创作新作品或"混音"其他社区成员生成的图像。 最有趣的是能够轻松训练自己的 LoRA (Low-Rank Adaptation)。过去这是一项复杂的任务,现在只需上传训练图像,分配触发名称,等待平台烘焙自定义图像模型即可。 使用现有的风格化模型,只需简单的提示词就能实现精美的动漫风格图像,无需明确告诉AI需要特定的风格、色调、着色等。 2、ChatGPT ChatGPT 是目前最受欢迎的通用聊天应用,其图像生成功能由 GPT-Im