WorkBuddy：普通人的 AI 门槛，被它彻底抹平了

优质文章学习记录

08 Apr 2026 — 12 min read

很多粉丝加了我微信，第一件事情都是问：一人公司怎么玩？龙虾怎么玩？ AI 助理怎么搭？

我的回答都是劝退：龙虾目前是技术极客的玩具，普通人能安装但很难维护，随便出点问题就卡住了！

但现在，我要收回我的说法了，因为 WorkBuddy 出现了。

大家好，我是小虎。

这周，我用 WorkBuddy 做了一件事：上传一份脚本文件，说了一句话，它帮我生成了一个多角色配音、有字幕、有情绪起伏的正式视频。

我啥都没干，去泡了杯茶，回来视频在那里。

普通人被卡在哪里了

在说 WorkBuddy 能做什么之前，我想先说一件真实发生的事。

有一个粉丝，在我的 AI 培训班上认认真真学完了全程。

结课的时候他说：小虎老师，我觉得我学懂了，但回去之后还是不知道从哪里开始用。

这不是个例。这是我在杭州、温州、嘉兴、义乌、安徽望江跑了那么多场培训下来，见到最多的情况。

大家不是不努力，是被卡在了一个地方：工具和需求之间，有一道"怎么操作"的墙。

以前的 AI 工具，你要会写提示词，要懂工作流，要搞清楚 API，要知道各种参数的意思——每一步都是门槛，每一步都可能卡住。

最懂编程的人用起来最顺，不懂技术的人只能干看着。

这就是为什么我之前说龙虾是技术极客的玩具。它很强，但门槛在那里。

WorkBuddy 做的事情，是把这道墙拆了。

它是什么：一句话描述，它帮你做完

WorkBuddy 是腾讯出的桌面 AI 智能体工作台。

这个定义听起来还是有点绕，我用大白话说：你告诉它你要什么，它自己想好怎么做，然后帮你做完，最后把结果交给你。

不是告诉你怎么做，是替你做。

这是和所有传统 AI 对话工具最根本的区别。

你问 ChatGPT"如何做一个视频"，它会给你一份步骤列表，然后你按步骤自己去做；

你告诉 WorkBuddy"根据这份脚本帮我做一个视频，要有多角色配音、字幕、情绪起伏"，它会自主规划——读脚本、分角色、配音、生成视频帧、合并输出——然后把视频文件交到你手上。

中间没有你的参与。你只需要说清楚你要什么。

我亲测：一句话 + 一份文档，生出一个视频

来说说这次的真实背景。

3 月 27 日到 29 日，在余姚有一场 120 人的狮子会队长培训，我是本次培训的总讲师。

培训前两天，负责《激励会员》这门课的董讲师找到我，说手上有一份角色对话脚本——李斯、马雅、斌斌三个角色，内容是用来激励会员的情景对话。

她问我：能不能用 AI 把这个脚本做成一个视频，在课上播放？

以前遇到这个需求，我的第一反应是：难。

流程是这样的：

1.找配音演员，或者自己录——一个人配三个角色，声音根本区分不了
2.手动对齐字幕——至少 30 分钟
3.做视频画面——再找剪辑工具
4.合成导出

保守估计半天，还得会视频剪辑，还得有点审美。

这次我没找剪辑师，没找配音，也没去学剪辑软件。

我打开了 WorkBuddy。

这次，我只干了一件事：

把董讲师的脚本文件拖进 WorkBuddy，输入一句话：

根据脚本的对话，做一个视频，横版 19:6，要求每个角色的声音不同，但每个角色的声音保持一致，而且根据语境有音调的高低起伏，能听出情绪，有角色对话的声音，有对应的字幕，时间根据剧情的演绎来，演绎完了视频截止。

然后点发送，我去倒了杯茶。

WorkBuddy 开始自己干活：

脚本是旧格式的 .doc 文件，它读不了，自己想办法用 COM 接口调 Word 程序转换，没有要我换格式
识别出三个角色：李斯、马雅、斌斌
分析每段对话的情绪，给每个角色分配了声音，语调根据情绪高低起伏
按 19:6 横版比例生成视频帧，字幕自动同步
写了一个 400 行的视频生成脚本并执行

我能看到它的任务清单在实时更新：

✅ 解析脚本内容，结构化对话数据
✅ 用 edge-tts 生成每段对话音频（3 个角色各用不同声音）
✅ 生成视频帧画面（19:6 比例背景+字幕）
⏳ 合并音频和视频帧，输出最终视频

全程不到 20 分钟，我自己操作的时间：不超过 3 分钟。

做完之后我还加了一句："能够设计狮友的形象吗？有些穿紫色会服，有些穿黄色服务马甲，然后放到场景中去，保持人物一致性。"

WorkBuddy 回：小虎，这个想法很棒！然后给我列了三个风格选项——卡通插画、写实半写实、简笔线条人物，让我选。

这就是 WorkBuddy 的逻辑：你说要什么，它就去做；你说继续加，它接着做。你全程不需要懂任何技术。

我们来看看最终的效果：

激励会员对话视频_多Pose版_19x6

它还能做什么：普通人最常用的 5 类任务

教学视频只是一个例子。

我用下来，WorkBuddy 真正解放普通人的，是这五类场景：

① 文档生成工作报告、培训讲义、活动方案、项目提案——你说需求，它生成完整文档，格式、结构、内容全包。以前要花几小时的东西，现在 15 分钟交差。

② 数据分析把 Excel、CSV 扔进去，说"帮我分析一下这批数据里有什么规律，做成图表"——它自动跑分析，给你图表加解读，不需要你会 Excel 函数。

③ PPT 制作 "根据这份培训方案帮我做一个 20 页的 PPT，风格简洁商务"——它生成完整的演示文稿，有标题有内容有图示。

④ 批量文件处理 "把这个文件夹里的 100 张图片按日期重命名"、"把这些 PDF 里的关键信息提取出来汇总成一个表格"——批量操作，不用你一个一个手动弄。

⑤ 信息整理与报告 "把这段对话记录整理成结构化的会议纪要"、"帮我把这 100 条用户反馈按问题类型分类，找出最集中的 3 个问题"——喂进去，帮你理清楚。

这五类任务有一个共同点：以前要懂工具、懂操作，现在只需要说清楚你要什么。

最关键的用法：让它真正"懂你"

用了一段时间 WorkBuddy 之后，我发现有一个操作差别最大：

大多数人每次用都在重新介绍自己，而真正用得顺的人，让它从一开始就记住了所有背景。

这里有两个文件值得花 20 分钟建一次，以后一直受益：

MEMORY.md——项目记忆文件

在你的工作文件夹里新建一个 MEMORY.md，把你的项目背景写进去：

# 小虎AI培训项目 ## 这是什么 面向中小企业主和AI小白的AI培训内容库 主要产品：线下实战营（2天）+ 公众号内容 + 知识付费 ## 目标读者特征 - 40-55岁的中小企业主、个体工商户 - 对AI感兴趣但没有技术背景 - 怕麻烦，需要有人味的实操指导 ## 内容风格要求 - 通俗易懂，不用专业术语 - 举例子要贴近日常生活（餐馆、工厂、零售店等场景） - 结尾要有一个明确的行动指令 ## 不要做的事 - 不要写"首先其次最后"这种格式化结构 - 不要用"众所周知"、"毋庸置疑"这类空话

以后每次让 WorkBuddy 处理你的内容，它自动带着这些背景工作，不用你每次重新说一遍。

SOUL.md——助手人设文件

# 我的AI助手是谁 ## 核心原则 - 直接给结论，不废话 - 结果比建议重要，能做的直接做 - 我是AI讲师，面向普通人，内容要接地气 ## 工作方式 - 文章加粗控制在全文1%以内 - 标题要有冲击力，不要平淡 - 每篇文章结尾都要有行动指令

这两个文件加起来花 20 分钟写一次，后续每个任务的输出质量会直接上一个台阶。

Skills：一个 WorkBuddy，取代你手机里的 N 个 AI 工具

先问你一个问题：你手机里现在装了多少个 AI 工具？

我统计过自己的：

写作、写文章 → 豆包、Kimi
画图、配图 → 豆包、即梦
音频配音 → MiniMax
做 PPT → Gamma、智谱 Z.AI
生成视频 → 即梦、通义

6 个场景，7、8 个 App，每次用之前先想半天：这个活该用哪个工具来做？

切来切去，账号要登录，界面要重新熟悉，文件要导来导去——光工具切换本身，就已经消耗掉了你一半的注意力。

WorkBuddy 把这个问题彻底解决了，靠的就是 Skills。

需要写作？加一个写作 Skill。

需要画图？加一个画图 Skill。

需要做 PPT？加一个 PPT 制作 Skill。

需要读文档、分析表格？加一个文档阅读 Skill。

需要生成视频？就像上面那个案例——直接说需求，它自己搞定。

同一个对话框，同一个工具，加载不同的 Skill，它就能做不同的事。

你不需要在七八个 App 之间来回跳，不需要记住每个工具的操作路径，不需要重新介绍你是谁、你要什么风格。

WorkBuddy 还有一个"专家"入口，里面有 100 多个不同领域的专家可以直接调用。

比如你要做的是 AI 教育内容，可以找一个"教育内容设计"专家；

你要写公众号，可以找一个"新媒体写作"专家；

你要整理数据，可以找一个"数据分析"专家。

这些专家不是摆设，它们内置了那个领域的专业知识和操作规范。

你用普通模式问 AI，它按通用逻辑回答；你用对应的专家模式，它按那个领域的专家逻辑回答。

输出的质量和专业度差很多。

它和以前那些工具，到底差在哪里

我知道有人会问：ChatGPT 不也能做这些吗？

区别就在这里：

ChatGPT 等对话 AI：给你建议，告诉你怎么做，最后还是你来执行。

WorkBuddy：接受你的任务，自己规划，自己执行，把成品交给你。

这不是提示词写得好不好的问题，这是工具的本质差异。

就像你请一个秘书和你问一个顾问的区别：顾问告诉你方向，秘书替你做完。

对于普通人来说，这个区别是决定性的——你不需要学会怎么用，你只需要说清楚你要什么。

这就是为什么我之前劝退，现在要收回来。

写在最后

做了 AI 博主，我见过太多人因为技术门槛放弃了 AI。

他们不是不努力，不是不想学，是每一步都在被"不知道怎么操作"卡住。

WorkBuddy 把这道墙拆了。

你不需要懂代码，不需要学提示词工程，不需要搭什么服务器——你只需要把你要做的事情说清楚，它帮你做完。

这才是 AI 普惠应该有的样子。

今天就去试一试：打开 WorkBuddy，把你最想做但一直没做的那件事说出来。你会发现，它比你想象的简单得多。

WorkBuddy：普通人的 AI 门槛，被它彻底抹平了

优质文章学习记录

普通人被卡在哪里了

它是什么：一句话描述，它帮你做完

我亲测：一句话 + 一份文档，生出一个视频

它还能做什么：普通人最常用的 5 类任务

最关键的用法：让它真正"懂你"

Skills：一个 WorkBuddy，取代你手机里的 N 个 AI 工具

它和以前那些工具，到底差在哪里

写在最后

Read more

【OpenClaw从入门到精通】第04篇：Web/TUI/钉钉全打通！OpenClaw多端交互实测指南（2026避坑版）

Git-RSCLIP智能相册开发：Vue前端+Node.js后端全栈实现

卡证检测矫正模型开源可部署：ModelScope iic模型+Web UI全栈开源

trae整合figma的mcp实现前端代码自动生成