DeerFlow 2.0 发布时,其官网标语 "Do Anything" 引人注目。这标志着字节跳动将该项目彻底重写,从最初的深度研究框架转型为 Super Agent 调度框架。新版本在发布当天便登顶 GitHub Trending 第一名,这不仅是功能迭代,更是运行环境的根本性蜕变。
背景:从 v1 到 v2 的跨越
DeerFlow(Deep Exploration and Efficient Research Flow)最初专注于 AI 深度研究——输入问题,它负责搜索、整理并输出报告。但社区的实际用法远超预期,开发者用它搭建数据流水线、生成演示文稿、自动化内容生产甚至快速构建 Dashboard。这让团队意识到,DeerFlow 本质上是一个让 Agent 真正把事情做完的运行环境。
核心变化在于代码完全重写。旧版(Deep Research 框架)保留在 1.x 分支,主开发线已全面转向 2.0。
核心定位:Super Agent Harness
官方将其定位为 Super Agent Harness(超级 Agent 调度框架)。简单来说,如果把大模型(如 DeepSeek, Kimi, Doubao)比作发动机,DeerFlow 就是那台复杂的 F1 赛车底盘。它将 Sub-agents(子智能体)、Memory(记忆)、Sandbox(沙箱)和 Skills(技能)完美地挂载在一起。
对开发者而言,以往编写 Agent 需要处理繁琐的上下文管理、文件读写权限和多任务并行。DeerFlow 2.0 将这些基础设施标准化了,让开发者能更专注于业务逻辑。
五大核心特性解析
1. Skills — Agent 能力的'乐高积木'
Skills 是 DeerFlow 能完成几乎任何事情的关键。一个标准 Skill 通常就是一个 Markdown 文件,定义了工作流、最佳实践和参考资源。内置了研究、报告生成、演示文稿制作、网页生成等场景的 Skill。
关键设计是按需渐进加载:不会一次性把所有 Skill 塞进上下文,只有任务确实需要时才加载,有效控制 Token 消耗。
例如通过 claude-to-deerflow skill,可以直接在终端与 DeerFlow 实例交互。安装命令如下:
npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow
2. Sub-Agents — 并行执行复杂任务
传统 Agent 处理复杂任务往往是'一条线走到底'。DeerFlow 不同:Lead Agent 会先拆解任务,然后动态拉起多个 Sub-Agent,条件允许时并行运行,最后汇总成完整输出。
一个典型的研究任务可以被拆成十几个 Sub-Agent,分别探索不同方向,最终合并成报告、网站或带视觉内容的演示文稿。这也是 DeerFlow 能处理'从几分钟到几小时'长任务的原因。
3. Sandbox 文件系统 — Agent 有了自己的'电脑'
这是 DeerFlow 和'带工具的聊天机器人'之间最根本的差别:Agent 有一台真正的'电脑'。
每个任务运行在隔离的 Docker 容器里,内有完整文件系统(如 /mnt/user-data/)。Agent 可以读写编辑文件、执行 Bash 命令和代码、查看图片,全程在 Sandbox 内完成,可审计、隔离,不同 session 之间互不污染。
4. Context Engineering — 长任务不'忘事'
DeerFlow 在上下文管理上做了两件事:
- Sub-Agent 上下文隔离:每个 Sub-Agent 只看到自己的上下文,不会被主 Agent 或其他 Sub-Agent 的信息干扰,保持专注。
- 摘要压缩:在单个 session 内,主动总结已完成的子任务、把中间结果转存到文件系统、压缩暂时不重要的信息,在长链路任务里也能保持聚焦,不会轻易打爆上下文窗口。
5. 长期记忆 — 越用越了解你
大多数 Agent 结束对话后一切归零,DeerFlow 2.0 跨 session 会逐步积累关于你的持久记忆:个人偏好、知识背景、写作风格、技术栈、重复出现的工作流。记忆保存在本地,控制权始终在你手里。
多端接入:不只是终端工具
DeerFlow 2.0 支持通过 IM 应用直接下发任务,无需公网 IP。连接后,你可以在聊天窗口里使用 /new、/models、/memory 等命令和 DeerFlow 交互,普通消息则作为自然语言任务处理。


