【实战指南】WorkBuddy 深度体验:腾讯程序员实测 3 种核心模式与 Skill 技能包,5 分钟上手 AI 办公

【实战指南】WorkBuddy 深度体验:腾讯程序员实测 3 种核心模式与 Skill 技能包,5 分钟上手 AI 办公
摘要:WorkBuddy 是腾讯推出的全场景 AI 智能体桌面工作台,不同于传统 AI 对话工具,它能直接操控本地文件完成任务。本文从一线程序员视角,深度解析 Craft/Plan/Ask 三种工作模式的使用策略、Skill 技能包系统的扩展能力、Automation 自动化与远程操控实战,以及多模型切换与 MCP 协议的进阶玩法,附带效率提升实测数据和新手避坑指南。

目录


前言

用了两周 WorkBuddy,我最大的感受是:它不是一个更会聊天的 AI,而是一个真正能帮你干活的 AI 同事。 这个区别比听起来大得多。

市面上的 AI 办公工具多如牛毛,但大多数停留在"对话式助手"阶段——你问它一个问题,它给你一段文字,然后你还是得自己复制粘贴、打开 Excel、创建文件夹……真正的执行环节,AI 缺席了。

腾讯在 2026 年 3 月推出的 WorkBuddy,试图填补的就是这个空白。它不是 ChatGPT 的套壳版,而是一个拥有本地文件操作权限的 AI 智能体——你给它一句话需求,它直接帮你在电脑上把事情做了。

这篇文章不是产品评测,是一个程序员用了两周后的实战总结。我会告诉你哪些功能值得用、哪些坑需要避开、以及如何 5 分钟上手。


一、WorkBuddy 是什么?—— 从 “AI 对话” 到 “AI 干活”

1.1 核心定位

一句话概括:WorkBuddy = AI 大脑 + 本地执行引擎

你可以把它理解为一个坐在你电脑旁边的智能同事。你说"帮我把桌面上的文件按类型整理",它不会给你一段教程让你自己弄——它直接帮你分好了。

1.2 和传统 AI 工具的本质区别

对比维度传统 AI 对话工具WorkBuddy
交互模式纯文字问答理解需求 → 拆解任务 → 执行操作
文件处理只能生成文本,用户自己粘贴直接在授权目录中读写文件
任务复杂度单步骤简单问答多步骤复杂工作流
输出形式文字回复可验收的成品(文档/表格/PPT/代码)
安全机制无本地权限目录授权 + 多模式权限控制
💡 核心区别:传统 AI 只能「说」,WorkBuddy 能「做」。它在你授权的文件夹里直接操作文件,而不是给你一段文字让你自己复制粘贴。

二、三种工作模式:选对模式是关键 🎯

WorkBuddy 最核心的设计是三种工作模式。选对模式,效率翻倍;选错模式,可能误操作。 新建任务时就要选好。

2.1 Craft 模式 —— 直接干活的「执行家」

AI 拥有最高操作权限,一句话下指令就立刻动手执行。

适用场景:目标明确、风险较低的任务。

# 示例:一句话指令"帮我把 ~/Downloads 里的文件按扩展名分类到不同文件夹""把这份 Markdown 转成公众号 HTML 格式""读取 data.csv,生成柱状图并保存为 PNG"

实测体验:文件整理类任务效率提升超 90%(原来几个小时的手动分类 → 15 分钟自动完成)。

2.2 Plan 模式 —— 先规划的「项目经理」

AI 先列出执行计划,你确认没问题后才逐步执行。

适用场景:复杂任务、涉及多文件操作、有一定风险的操作。

# 示例:复杂任务指令"分析上周的销售数据,找出 Top 10 产品,生成周报 PPT"# AI 会先输出计划:# Step 1: 读取 sales_data.xlsx# Step 2: 按产品维度聚合,计算销售额排名# Step 3: 生成数据可视化图表# Step 4: 创建 PPT 模板,填入数据和图表# Step 5: 保存为 weekly_report.pptx# → 你确认后才开始执行
⚠️ 重要建议:涉及重要文件操作时,务必先用 Plan 模式确认。我有一次用 Craft 模式让它整理文件,它的分类逻辑和我预期不同,虽然没丢文件,但多花了时间重新调整。

2.3 Ask 模式 —— 只聊不碰的「顾问」

纯咨询问答,不操作任何文件。适合不确定的时候先问问。

# 示例"这段 Go 代码有什么性能问题?""Kubernetes 的 HPA 和 VPA 分别什么场景用?""帮我 review 一下这个 SQL,有没有注入风险?"

2.4 三种模式实战搭配策略

场景推荐模式原因
文件整理/批量重命名Craft目标明确,直接执行最高效
数据分析出报告Plan → Craft先确认分析维度,再执行
代码审查/技术咨询Ask只需建议,不需修改文件
生成公众号文章Craft输出结果可直接预览验收
重构大型项目Plan必须先确认改动范围
不确定能不能做Ask → Plan → Craft逐步确认,降低风险
💡 老码农经验:我的使用习惯是——日常小任务用 Craft(文件整理、内容生成),大工程用 Plan(涉及多文件操作先看计划),不确定的先 Ask(问清楚再决定要不要让它动手)。三种模式搭配使用效果最好——先 Plan 确认方案,再 Craft 执行。

三、Skill 技能包系统:给 AI 装外挂 🔌

3.1 Skill 是什么?

Skills 本质上是功能模块包,每个 Skill 都是一套针对特定场景的知识 + 能力 + 工作流的集合。相当于给通用 AI 装上了领域外挂。

3.2 内置 Skill 分类

WorkBuddy 开箱自带 30+ 预设 Skills,覆盖主流办公场景:

类别典型 Skill能力说明
✍️ 内容创作ai-content-creator一个主题 → 公众号文章 + 小红书帖子 + ZEEKLOG 博客 + 配图
📊 数据分析xlsxExcel 数据清洗、图表生成、报告输出
📁 文件处理pdf / docx / pptxPDF 解析、Word 编辑、PPT 制作
🔧 开发运维playwright-cli浏览器自动化、截图、表单填写
🌐 浏览器自动化Browser Automation网页交互、Web 内容提取

3.3 三种扩展方式

如果预设 Skill 不够用,有三种扩展途径:

# 1. SkillHub 市场 —— 官方技能商店,一键安装# 在左侧栏点击"技能"→ 浏览市场 → 点击安装# 2. 社区生态 —— 兼容 OpenClaw 技能生态# 社区开发的数百个技能包直接可用,无需额外适配# 3. 自定义创建 —— 把工作流封装成 Skill# 创建 SKILL.md 文件,定义角色、流程、参考资源# 放到 ~/.workbuddy/skills/ 目录即可使用

3.4 自定义 Skill 示例

以我自己创建的 ai-content-creator Skill 为例:

# SKILL.md 核心结构 ## 角色定义 以专业自媒体内容策划师的身份运作 ## 执行流程 1. 搜索相关内容(web_search) 2. 确定输出目录 3. 生成小红书内容(文案 + 卡片图) 4. 生成公众号文章(HTML + 封面图) 5. 生成 ZEEKLOG 博客(Markdown + 封面图) 6. 输出检查清单 ## 参考资源 - references/html_template.md - references/ZEEKLOG_template.md 

这套 Skill 能让我用一句话指令,同时生成三个平台的内容。实测单次完整执行大约 5-10 分钟,手动做同样的事至少要 2-3 小时。

3.5 安全注意事项

⚠️ 安装第三方 Skill 前一定检查安全等级:LOW/MEDIUM:可以安装HIGH:需谨慎审查EXTREME:建议不装

重点关注是否有:网络访问异常、索要 API 密钥、访问 ~/.ssh 等敏感目录的行为。

四、自动化 + 远程操控:让 AI 帮你自动打工 ⏰

4.1 Automation 定时任务

WorkBuddy 的 Automation 功能让 AI 变成了你的「定时打工人」:

# 自动化典型配置示例自动化任务: 每日行业新闻日报 频率: FREQ=DAILY;BYHOUR=9;BYMINUTE=0 # 每天早上 9 点工作目录: ~/WorkBuddy/daily-news/ 任务描述: 搜索 AI 行业最新动态,生成日报 Markdown 文件 

实测场景

自动化场景频率节省时间
AI 行业新闻日报每天 9:00~30 分钟/天
数据分析周报每周一 10:00~2 小时/周
文件夹自动归档每天 18:00~15 分钟/天
热点内容追踪每 2 小时持续监控

4.2 远程操控

通过企微、QQ、飞书、钉钉等 IM 连接电脑后,手机发条消息就能让办公室电脑干活

# 远程操控配置流程(1 分钟搞定)1. WorkBuddy 设置 → 连接 → 选择 IM 平台 2. 扫码绑定 3. 在 IM 中给 WorkBuddy 发消息 = 在电脑上下指令 
💡 亲测在地铁上发了条消息让它准备会议材料,到公司打开电脑就看到做好的 PPT 了。通勤时间 → 生产力时间。

4.3 效率提升实测数据

任务类型传统方式WorkBuddy效率提升
文件整理(100+文件)2-3 小时15 分钟90%+
周报生成30 分钟5 分钟83%
数据清洗 + 图表1 小时15 分钟75%
多平台内容生成2-3 小时10 分钟90%+

五、多模型切换与 MCP 协议:进阶玩法 🔀

5.1 内置模型矩阵

WorkBuddy 内置了多个主流大模型,不用自己配 Token,一键切换

模型擅长领域推荐场景
混元(腾讯自研)中文理解、内容创作写文案、写文章
DeepSeek代码生成、逻辑推理编程、代码审查
GLM数据分析、结构化输出数据处理、报告生成
Kimi长文本处理长文档分析
MiniMax多模态图文理解
💡 选模型经验:写代码用 DeepSeek,写文案用混元,数据分析用 GLM,各取所长效果最好。

5.2 MCP 协议扩展

MCP(Model Context Protocol) 让 WorkBuddy 可以连接各种外部工具和服务:

// ~/.workbuddy/mcp.json 配置示例{"mcpServers":{"playwright":{"command":"npx","args":["@playwright/mcp@latest"]},"github":{"command":"npx","args":["@github/mcp-server"]}}}

MCP 典型扩展场景

  • Playwright:浏览器自动化、网页截图、表单填写
  • GitHub:代码仓库管理、Issue 跟踪、PR 审查
  • 数据库:直接查询 MySQL/PostgreSQL,数据分析
  • 文件系统:扩展文件操作能力

六、5 分钟新手上手指南 🚀

Step 1: 下载安装

# 访问官网下载 https://codebuddy.cn/work/ # Windows 和 Mac 都支持,下载即用

Step 2: 登录 & 领取额度

  • 新用户注册即送 5000 Credits 体验额度
  • 够用好一阵子了,先充分体验

Step 3: 授权工作目录

首次使用需要授权工作文件夹,AI 只能在授权范围内操作,安全可控。

Step 4: 选模式下任务

# 建议新手第一个任务用 Ask 模式"介绍一下你能做什么?"# 第二个任务用 Plan 模式"帮我分析一下这份 Excel 数据,列出执行计划"# 熟悉后用 Craft 模式"把这些文件按日期整理到对应文件夹"

Step 5: 查收结果

右侧结果区查看生成的文件,支持预览和下载。

避坑清单

  • 重要文件操作 → 先用 Plan 模式确认
  • 第三方 Skill → 安装前检查安全等级
  • 远程操控 → 建议第一时间配好(企微/QQ/飞书)
  • 模型选择 → 不同任务切换不同模型
  • 授权目录 → 不要授权根目录或系统目录
  • 定时任务 → 设好 Automation,让 AI 替你值班

七、总结与综合评价

7.1 核心结论

用了两周的真实感受:WorkBuddy 是目前我用过的最接近「AI 同事」概念的产品。它不是让你更好地跟 AI 聊天,而是让 AI 直接帮你干活。

三个最值得用的功能:

  1. 三种模式的智能切换——既有 Craft 的高效执行力,又有 Plan 的安全兜底
  2. Skill 技能包系统——让 AI 的能力可以无限扩展,自定义工作流复用价值极高
  3. 远程操控——通勤时间变成生产力时间

7.2 综合评分

维度评分说明
易用性⭐⭐⭐⭐⭐自然语言交互,零学习成本
功能深度⭐⭐⭐⭐⭐三种模式 + Skill + Automation + MCP
执行能力⭐⭐⭐⭐复杂任务偶尔需要多轮调教
安全机制⭐⭐⭐⭐⭐目录授权 + 模式分级 + Skill 安全审查
生态扩展⭐⭐⭐⭐兼容 OpenClaw,社区生态持续壮大
性价比⭐⭐⭐⭐⭐免费 5000 Credits,足够深度体验

7.3 适合谁用?

人群核心价值
程序员代码审查、文件批处理、文档生成
自媒体人多平台内容一键生成
数据分析师Excel 清洗 + 可视化 + 报告一条龙
项目经理周报日报自动化、会议材料准备
运营人员数据监控、竞品分析、内容排期

八、参考资料


📢 你最想让 AI 帮你自动化哪项工作?Craft / Plan / Ask 你最常用哪个模式? 欢迎评论区聊聊,分享你的使用经验!

如果本文有帮助,欢迎 点赞 👍 收藏 ⭐ 关注,持续输出 AI 工具实战干货!

更多 AI 实战干货,关注公众号「一粒黑子」,扫码关注不迷路 👇

Read more

飞算JavaAI全流程实操指南:从需求到部署的智能开发体验

飞算JavaAI全流程实操指南:从需求到部署的智能开发体验

引言 作为Java开发者,你是否也曾陷入这样的循环:需求文档翻来覆去读半天,接口设计改了又改,代码敲到手指发麻,调试时还得对着SQL报错抓头发?传统开发中80%的时间都耗在重复编码、逻辑校验、文档撰写上,真正留给业务创新的精力少得可怜。而今天,飞算JavaAI的出现正在重构这一切——从自然语言需求到可部署工程,全流程智能化让开发效率实现质的飞跃。接下来,我们就通过实战案例带你体验这场开发革命。 文章目录 * 引言 * 一、智能引导设计实战:3步完成需求到代码的转化 * 二、代码生成与调优:从基础框架到企业级实践 * 三、工程构建与文档生成:一键完成项目交付 * 四、同类产品对比:飞算JavaAI的核心优势 * 结语: 一、智能引导设计实战:3步完成需求到代码的转化 当产品经理甩来一句“做个员工绩效查询功能”时,你不用再纠结“接口参数怎么定”“分页逻辑放哪层”。飞算JavaAI的智能引导设计,让需求到代码的转化像聊天一样简单。 1.1 自然语言描述和需求理解:怎么说,AI就怎么懂 不用写规范的PRD,

CPO(共封装光学)技术原理深度剖析:AI时代高速光互连底层逻辑

CPO(共封装光学)技术原理深度剖析:AI时代高速光互连底层逻辑

前言 随着AI大模型、万卡算力集群、800G/1.6T高速通信成为行业主流,传统电互连与可插拔光模块方案遭遇功耗墙、带宽墙、物理墙三重瓶颈,信号损耗、能耗失控、延迟过高的问题愈发突出。 CPO(Co-Packaged Optics,共封装光学)作为下一代高速互连技术,并非简单的模块集成,而是从芯片架构、封装工艺、光电转换底层重构传输逻辑,成为破解算力传输瓶颈的核心方案。本篇抛开泛泛的产业解读,深挖CPO技术原理、光电协同机制、架构设计与核心难点,让硬核开发者吃透底层逻辑。 核心定位:CPO是将光引擎与计算/交换芯片进行2.5D/3D异构共封,缩短电信号路径,实现芯片级光电融合,达成低功耗、超高带宽、低延迟的高速互连。 一、CPO技术核心定义与底层动因 1.1 标准定义 CPO全称Co-Packaged Optics(共封装光学),依托先进异构封装工艺,将光收发引擎(硅光芯片、激光器、探测器)

安装 Node.js 22+,配置 OpenAI Node.js 库、Vercel AI SDK 基础环境

文章目录 * 一、安装 Node.js 22+ * 二、初始化项目与安装依赖 * 1. 新建项目文件夹,终端进入目录,执行初始化命令: * 2. 安装核心依赖: * 三、基础配置(关键步骤) * 1. 配置 OpenAI 库 * 2. 配置 Vercel AI SDK * 四、运行测试 一、安装 Node.js 22+ 1. 官网下载:访问 Node.js 官网,选择 v22.x 稳定版(LTS 或 Current 均可),按系统(Windows/Mac/

find-skills技能全解析:一键解决AI Agent技能搜索、安装与管理痛点

find-skills技能全解析:一键解决AI Agent技能搜索、安装与管理痛点 在AI Agent使用过程中,“找技能、装技能、管技能”是多数用户面临的核心难题——要么四处搜罗技能资源,要么切换平台搜索打断工作流,要么安装后难以统一管理更新。此前在Skills蓝皮书分享过的Skills.sh资源库中,一款名为find-skills的技能异军突起,不仅登顶24h安装榜榜首,长期稳居总榜第二且持续上升,日均安装量突破10k+,与第二名拉开显著差距。 这款由Vercel官方发布的技能,之所以能快速走红,核心在于它完美解决了技能获取与管理的全流程痛点,无需切换平台、无需复杂操作,仅需在单个Agent中运行,就能完成技能搜索、安装、检查、更新的闭环。本文将从核心优势、详细操作步骤、注意事项三个维度,全方位解析find-skills的使用方法,帮助用户高效利用AI Agent技能,提升工作效率。 一、find-skills核心优势:为什么它能成为“技能神器”? 在find-skills出现之前,用户获取技能的方式普遍存在诸多弊端,而它的出现的实现了技能管理的“一站式闭环”,具体优势对比及