WorkBuddy:普通人的 AI 门槛,被它彻底抹平了

WorkBuddy:普通人的 AI 门槛,被它彻底抹平了

很多粉丝加了我微信,第一件事情都是问:一人公司怎么玩? 龙虾怎么玩? AI 助理怎么搭? 

我的回答都是劝退:龙虾目前是技术极客的玩具,普通人能安装但很难维护,随便出点问题就卡住了! 

但现在,我要收回我的说法了,因为 WorkBuddy 出现了。

大家好,我是小虎。

Image

这周,我用 WorkBuddy 做了一件事:上传一份脚本文件,说了一句话,它帮我生成了一个多角色配音、有字幕、有情绪起伏的正式视频。

我啥都没干,去泡了杯茶,回来视频在那里。

普通人被卡在哪里了

在说 WorkBuddy 能做什么之前,我想先说一件真实发生的事。

有一个粉丝,在我的 AI 培训班上认认真真学完了全程。

结课的时候他说:小虎老师,我觉得我学懂了,但回去之后还是不知道从哪里开始用。

这不是个例。这是我在杭州、温州、嘉兴、义乌、安徽望江跑了那么多场培训下来,见到最多的情况。

大家不是不努力,是被卡在了一个地方:工具和需求之间,有一道"怎么操作"的墙。

以前的 AI 工具,你要会写提示词,要懂工作流,要搞清楚 API,要知道各种参数的意思——每一步都是门槛,每一步都可能卡住。

最懂编程的人用起来最顺,不懂技术的人只能干看着。

这就是为什么我之前说龙虾是技术极客的玩具。它很强,但门槛在那里。

WorkBuddy 做的事情,是把这道墙拆了。

它是什么:一句话描述,它帮你做完

WorkBuddy 是腾讯出的桌面 AI 智能体工作台。

这个定义听起来还是有点绕,我用大白话说:你告诉它你要什么,它自己想好怎么做,然后帮你做完,最后把结果交给你。

不是告诉你怎么做,是替你做。

这是和所有传统 AI 对话工具最根本的区别。

你问 ChatGPT"如何做一个视频",它会给你一份步骤列表,然后你按步骤自己去做;

你告诉 WorkBuddy"根据这份脚本帮我做一个视频,要有多角色配音、字幕、情绪起伏",它会自主规划——读脚本、分角色、配音、生成视频帧、合并输出——然后把视频文件交到你手上。

中间没有你的参与。你只需要说清楚你要什么。

我亲测:一句话 + 一份文档,生出一个视频

来说说这次的真实背景。

3 月 27 日到 29 日,在余姚有一场 120 人的狮子会队长培训,我是本次培训的总讲师。

培训前两天,负责《激励会员》这门课的董讲师找到我,说手上有一份角色对话脚本——李斯、马雅、斌斌三个角色,内容是用来激励会员的情景对话。

她问我:能不能用 AI 把这个脚本做成一个视频,在课上播放?

以前遇到这个需求,我的第一反应是:难。

流程是这样的:

  1. 1.找配音演员,或者自己录——一个人配三个角色,声音根本区分不了
  2. 2.手动对齐字幕——至少 30 分钟
  3. 3.做视频画面——再找剪辑工具
  4. 4.合成导出

保守估计半天,还得会视频剪辑,还得有点审美。

这次我没找剪辑师,没找配音,也没去学剪辑软件。

我打开了 WorkBuddy。

这次,我只干了一件事:

把董讲师的脚本文件拖进 WorkBuddy,输入一句话:

根据脚本的对话,做一个视频,横版 19:6,要求每个角色的声音不同,但每个角色的声音保持一致,而且根据语境有音调的高低起伏,能听出情绪,有角色对话的声音,有对应的字幕,时间根据剧情的演绎来,演绎完了视频截止。

Image

然后点发送,我去倒了杯茶。

WorkBuddy 开始自己干活:

  • 脚本是旧格式的 .doc 文件,它读不了,自己想办法用 COM 接口调 Word 程序转换,没有要我换格式
  • 识别出三个角色:李斯、马雅、斌斌
  • 分析每段对话的情绪,给每个角色分配了声音,语调根据情绪高低起伏
  • 按 19:6 横版比例生成视频帧,字幕自动同步
  • 写了一个 400 行的视频生成脚本并执行

我能看到它的任务清单在实时更新:

  • ✅ 解析脚本内容,结构化对话数据
  • ✅ 用 edge-tts 生成每段对话音频(3 个角色各用不同声音)
  • ✅ 生成视频帧画面(19:6 比例背景+字幕)
  • ⏳ 合并音频和视频帧,输出最终视频

全程不到 20 分钟,我自己操作的时间:不超过 3 分钟。

做完之后我还加了一句:"能够设计狮友的形象吗?有些穿紫色会服,有些穿黄色服务马甲,然后放到场景中去,保持人物一致性。"

Image

WorkBuddy 回:小虎,这个想法很棒!然后给我列了三个风格选项——卡通插画、写实半写实、简笔线条人物,让我选。

这就是 WorkBuddy 的逻辑:你说要什么,它就去做;你说继续加,它接着做。你全程不需要懂任何技术。

我们来看看最终的效果:

激励会员对话视频_多Pose版_19x6

它还能做什么:普通人最常用的 5 类任务

教学视频只是一个例子。

我用下来,WorkBuddy 真正解放普通人的,是这五类场景:

① 文档生成 工作报告、培训讲义、活动方案、项目提案——你说需求,它生成完整文档,格式、结构、内容全包。以前要花几小时的东西,现在 15 分钟交差。

② 数据分析 把 Excel、CSV 扔进去,说"帮我分析一下这批数据里有什么规律,做成图表"——它自动跑分析,给你图表加解读,不需要你会 Excel 函数。

③ PPT 制作 "根据这份培训方案帮我做一个 20 页的 PPT,风格简洁商务"——它生成完整的演示文稿,有标题有内容有图示。

④ 批量文件处理 "把这个文件夹里的 100 张图片按日期重命名"、"把这些 PDF 里的关键信息提取出来汇总成一个表格"——批量操作,不用你一个一个手动弄。

⑤ 信息整理与报告 "把这段对话记录整理成结构化的会议纪要"、"帮我把这 100 条用户反馈按问题类型分类,找出最集中的 3 个问题"——喂进去,帮你理清楚。

这五类任务有一个共同点:以前要懂工具、懂操作,现在只需要说清楚你要什么。

最关键的用法:让它真正"懂你"

用了一段时间 WorkBuddy 之后,我发现有一个操作差别最大:

大多数人每次用都在重新介绍自己,而真正用得顺的人,让它从一开始就记住了所有背景。

这里有两个文件值得花 20 分钟建一次,以后一直受益:

MEMORY.md——项目记忆文件

在你的工作文件夹里新建一个 MEMORY.md,把你的项目背景写进去:

# 小虎AI培训项目 ## 这是什么 面向中小企业主和AI小白的AI培训内容库 主要产品:线下实战营(2天)+ 公众号内容 + 知识付费 ## 目标读者特征 - 40-55岁的中小企业主、个体工商户 - 对AI感兴趣但没有技术背景 - 怕麻烦,需要有人味的实操指导 ## 内容风格要求 - 通俗易懂,不用专业术语 - 举例子要贴近日常生活(餐馆、工厂、零售店等场景) - 结尾要有一个明确的行动指令 ## 不要做的事 - 不要写"首先其次最后"这种格式化结构 - 不要用"众所周知"、"毋庸置疑"这类空话

以后每次让 WorkBuddy 处理你的内容,它自动带着这些背景工作,不用你每次重新说一遍。

SOUL.md——助手人设文件

# 我的AI助手是谁 ## 核心原则 - 直接给结论,不废话 - 结果比建议重要,能做的直接做 - 我是AI讲师,面向普通人,内容要接地气 ## 工作方式 - 文章加粗控制在全文1%以内 - 标题要有冲击力,不要平淡 - 每篇文章结尾都要有行动指令

这两个文件加起来花 20 分钟写一次,后续每个任务的输出质量会直接上一个台阶。

Skills:一个 WorkBuddy,取代你手机里的 N 个 AI 工具

先问你一个问题:你手机里现在装了多少个 AI 工具?

我统计过自己的:

  • 写作、写文章 → 豆包、Kimi
  • 画图、配图 → 豆包、即梦
  • 音频配音 → MiniMax
  • 做 PPT → Gamma、智谱 Z.AI
  • 生成视频 → 即梦、通义

6 个场景,7、8 个 App,每次用之前先想半天:这个活该用哪个工具来做?

切来切去,账号要登录,界面要重新熟悉,文件要导来导去——光工具切换本身,就已经消耗掉了你一半的注意力。

WorkBuddy 把这个问题彻底解决了,靠的就是 Skills。

需要写作?加一个写作 Skill。 

需要画图?加一个画图 Skill。 

需要做 PPT?加一个 PPT 制作 Skill。 

需要读文档、分析表格?加一个文档阅读 Skill。 

需要生成视频?就像上面那个案例——直接说需求,它自己搞定。

同一个对话框,同一个工具,加载不同的 Skill,它就能做不同的事。

你不需要在七八个 App 之间来回跳,不需要记住每个工具的操作路径,不需要重新介绍你是谁、你要什么风格。

WorkBuddy 还有一个"专家"入口,里面有 100 多个不同领域的专家可以直接调用。

比如你要做的是 AI 教育内容,可以找一个"教育内容设计"专家;

你要写公众号,可以找一个"新媒体写作"专家;

你要整理数据,可以找一个"数据分析"专家。

这些专家不是摆设,它们内置了那个领域的专业知识和操作规范。

你用普通模式问 AI,它按通用逻辑回答;你用对应的专家模式,它按那个领域的专家逻辑回答。

输出的质量和专业度差很多。

它和以前那些工具,到底差在哪里

我知道有人会问:ChatGPT 不也能做这些吗?

区别就在这里:

ChatGPT 等对话 AI:给你建议,告诉你怎么做,最后还是你来执行。

WorkBuddy:接受你的任务,自己规划,自己执行,把成品交给你。

这不是提示词写得好不好的问题,这是工具的本质差异。

就像你请一个秘书和你问一个顾问的区别:顾问告诉你方向,秘书替你做完。

对于普通人来说,这个区别是决定性的——你不需要学会怎么用,你只需要说清楚你要什么。

这就是为什么我之前劝退,现在要收回来。

写在最后

做了 AI 博主,我见过太多人因为技术门槛放弃了 AI。

他们不是不努力,不是不想学,是每一步都在被"不知道怎么操作"卡住。

WorkBuddy 把这道墙拆了。

你不需要懂代码,不需要学提示词工程,不需要搭什么服务器——你只需要把你要做的事情说清楚,它帮你做完。

这才是 AI 普惠应该有的样子。

今天就去试一试:打开 WorkBuddy,把你最想做但一直没做的那件事说出来。你会发现,它比你想象的简单得多。

Read more

【OpenClaw从入门到精通】第04篇:Web/TUI/钉钉全打通!OpenClaw多端交互实测指南(2026避坑版)

【OpenClaw从入门到精通】第04篇:Web/TUI/钉钉全打通!OpenClaw多端交互实测指南(2026避坑版)

摘要:本文聚焦OpenClaw三大核心交互方式,针对新手“不知如何与AI助理沟通”的痛点,提供Web控制台、TUI终端、聊天软件(以钉钉为核心)的完整实操流程。Web控制台适配电脑端深度配置,TUI终端适合服务器远程维护,聊天软件满足手机端移动办公,三者协同实现“随时随地召唤AI”。文中包含2026实测的命令代码、配置步骤、问题排查方案,所有案例为虚拟构建,代码未上传GitHub,兼顾新手入门与进阶实操,帮助读者快速打通多端交互,最大化OpenClaw使用效率。 优质专栏欢迎订阅! 【DeepSeek深度应用】【Python高阶开发:AI自动化与数据工程实战】【YOLOv11工业级实战】 【机器视觉:C# + HALCON】【大模型微调实战:平民级微调技术全解】 【人工智能之深度学习】【AI 赋能:Python 人工智能应用实战】【数字孪生与仿真技术实战指南】 【AI工程化落地与YOLOv8/v9实战】【C#工业上位机高级应用:高并发通信+性能优化】 【Java生产级避坑指南:高并发+性能调优终极实战】【Coze搞钱实战:零代码打造吸金AI助手】

Git-RSCLIP智能相册开发:Vue前端+Node.js后端全栈实现

Git-RSCLIP智能相册开发:Vue前端+Node.js后端全栈实现 你是不是也有过这样的经历?手机里存了几千张照片,想找一张“去年夏天在海边拍的、有红色遮阳伞和狗狗”的照片,结果翻了半小时也没找到。传统的相册应用只能按时间、地点或手动添加的标签来搜索,一旦标签没打好,照片就像石沉大海。 现在,情况不一样了。想象一下,你只需要在搜索框里输入“红色汽车的照片”,或者“有彩虹的风景照”,系统就能瞬间从成千上万张照片中精准地找到它们。这听起来像是科幻电影里的场景,但今天,我们就要用Git-RSCLIP模型,结合Vue3和Node.js,亲手把它变成现实。 这篇文章,我就带你一步步搭建一个基于自然语言搜索的智能相册系统。我们不用去理解复杂的深度学习算法,而是聚焦于如何将前沿的AI能力,通过一套清晰、可落地的全栈技术方案,变成一个真正能用的产品。无论你是前端开发者想了解如何接入AI能力,还是后端工程师想学习向量数据库的应用,都能在这里找到答案。 1. 为什么我们需要智能相册? 在开始敲代码之前,我们先聊聊为什么传统的相册管理方式已经不够用了。 我自己的手机里大概有8000多张照

卡证检测矫正模型开源可部署:ModelScope iic模型+Web UI全栈开源

卡证检测矫正模型开源可部署:ModelScope iic模型+Web UI全栈开源 你是不是也遇到过这样的烦恼?财务报销时,需要上传身份证照片,但拍歪了,系统死活识别不出来;办理线上业务,上传的驾照照片有透视变形,审核总是失败。手动裁剪、旋转、矫正,费时费力,效果还不好。 今天,我要介绍一个能彻底解决这个痛点的“神器”——一个基于ModelScope开源模型 iic/cv_resnet_carddetection_scrfd34gkps 构建的卡证检测与矫正全栈应用。它不仅能把图片里的身份证、护照、驾照等卡证“框”出来,还能精准定位四个角点,并一键输出“扶正”后的标准正视角图片。最关键的是,它自带一个中文Web界面,开箱即用,从模型到前端,全部开源可部署。 无论你是开发者想集成这个功能,还是业务人员想快速处理大量卡证图片,这篇文章都将带你从零开始,完整了解并上手这个工具。 1. 它能做什么?解决什么实际问题? 简单来说,

trae整合figma的mcp实现前端代码自动生成

1.现在trae版本在3.0及以上版本。 2.trae账号是企业版。 3.打开设置,找到mcp 这里需要token,需要从figma账号里生成,网页登录figma账号,找到设置,打开后找到security,然后点击generate new token,token名称随便取,权限都钩上。然后生成一个token,把token放到mcp中即可。 4.使用mcp,切换到mcp模式,你也可以自己创建智能体使用 5.提问使用,可参考下面的提示词使用 注意:这里面的figma链接是mcp的链接,不是figma链接,一般需要你有原型的权限才能看到 我需要根据提供的Figma链接生成一个与设计稿高度一致的网页。请严格遵循以下详细要求: