DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录

10 Apr 2026 — 6 min read

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

作者：madprinter
日期：2026-03-24
项目地址：https://github.com/bytedance/deer-flow

项目介绍

DeerFlow（Deep Exploration and Efficient Research Flow）是字节跳动开源的一款超级 Agent 框架。2026 年 2 月 28 日，DeerFlow 2.0 正式发布后迅速登顶 GitHub Trending 榜首，目前已有近 40,000 颗星。

与传统的 AI 框架不同，DeerFlow 不仅仅是一个"聊天机器人"，它是一个真正能干活的 Agent 运行环境。它拥有自己的文件系统、沙箱执行环境、长期记忆系统，可以自主规划任务并调度多个子 Agent 协同工作。

为什么 DeerFlow 值得关注？

大厂背书：字节跳动出品，经过真实业务场景验证
架构先进：基于 LangGraph 和 LangChain 构建，设计优雅
功能完整：开箱即用的文件系统、记忆系统、沙箱执行
高度可扩展：支持自定义技能、工具、MCP 服务器
多模型支持：兼容 OpenAI API 格式的所有大模型

核心功能

1. 技能系统（Skills）

DeerFlow 的核心是技能系统。每个技能是一个结构化的能力模块，包含工作流程、最佳实践和相关资源引用。

内置技能包括：

🔍 深度研究（Research）
📝 报告生成（Report Generation）
📊 PPT 制作（Slide Creation）
🌐 网页生成（Web Page）
🎨 图片/视频生成（Image/Video Generation）

技能按需加载，不会一次性占用大量上下文，这对 Token 敏感的模型非常友好。

/mnt/skills/public ├── research/SKILL.md ├── report-generation/SKILL.md ├── slide-creation/SKILL.md ├── web-page/SKILL.md └── image-generation/SKILL.md

2. 子 Agent 系统（Sub-Agents）

复杂任务很少能一次完成。DeerFlow 可以将任务分解，动态生成多个子 Agent 并行执行。

每个子 Agent 有独立的作用域上下文
子 Agent 可以并行执行，提高效率
主 Agent 负责汇总所有结果，生成最终输出

例如：一个研究任务可以分解为十多个子 Agent，每个探索不同角度，最终汇聚成一份完整报告。

3. 沙箱执行环境（Sandbox）

DeerFlow 不只是"说说而已"，它有自己的"电脑"——每个任务在独立的 Docker 容器中运行：

✅ 完整的文件系统
✅ Bash 命令执行
✅ 代码运行能力
✅ 图片查看能力
✅ 会话隔离，零污染

/mnt/user-data/ ├── uploads/ # 用户上传的文件 ├── workspace/ # Agent 工作目录 └── outputs/ # 最终交付物

4. 长期记忆（Long-Term Memory）

大多数 Agent 在对话结束后就忘记一切。DeerFlow 会记住：

用户画像和偏好
技术栈信息
重复的工作流程
历史交互经验

记忆本地存储，完全由用户控制。系统会自动去重，避免重复信息无限累积。

5. 多通道集成（IM Channels）

DeerFlow 支持多种即时通讯工具接入：

通道	传输方式	难度
Telegram	Bot API (长轮询)	简单
Slack	Socket Mode	中等
飞书/Lark	WebSocket	中等

无需公网 IP，所有通道配置后即可自动启动。

6. Claude Code 集成

通过 claude-to-deerflow 技能，可以直接在 Claude Code 中与 DeerFlow 交互：

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

支持的功能：

发送任务并获取流式响应
选择执行模式：flash/fast/standard/pro/ultra
查看健康状态、模型、技能列表
管理对话线程和历史
上传文件进行分析

使用方法

快速开始

1. 克隆项目

git clone https://github.com/bytedance/deer-flow.git cd deer-flow

2. 生成配置文件

make config

这会基于模板创建本地配置文件。

3. 配置模型

编辑 config.yaml，配置至少一个模型：

models:-name: gpt-4display_name: GPT-4use: langchain_openai:ChatOpenAI model: gpt-4api_key: $OPENAI_API_KEY max_tokens:4096temperature:0.7-name: openrouter-gemini-2.5-flash display_name: Gemini 2.5 Flash (OpenRouter) use: langchain_openai:ChatOpenAI model: google/gemini-2.5-flash-preview api_key: $OPENAI_API_KEY base_url: https://openrouter.ai/api/v1

4. 设置 API Key

推荐方式：编辑项目根目录的 .env 文件

TAVILY_API_KEY=your-tavily-api-key OPENAI_API_KEY=your-openai-api-key INFOQUEST_API_KEY=your-infoquest-api-key

5. 启动服务

Docker 方式（推荐）：

make docker-init # 拉取沙箱镜像（只需一次）make docker-start # 启动服务

本地开发方式：

make check # 检查依赖makeinstall# 安装依赖make dev # 启动服务

访问：http://localhost:2026

飞书/钉钉集成示例

在 config.yaml 中配置：

channels:feishu:enabled:trueapp_id: $FEISHU_APP_ID app_secret: $FEISHU_APP_SECRET slack:enabled:truebot_token: $SLACK_BOT_TOKEN app_token: $SLACK_APP_TOKEN

在 .env 中设置对应的密钥即可。

技术架构

DeerFlow 2.0 是完全重写的版本，与 1.x 没有任何代码共享。核心架构：

┌─────────────────────────────────────────┐ │ Gateway (API Gateway) │ ├─────────────────────────────────────────┤ │ LangGraph Agent Server │ ├──────────────┬──────────────┬───────────┤ │ Skills │ Tools │ Memory │ ├──────────────┴──────────────┴───────────┤ │ Sandbox (Docker/K8s) │ └─────────────────────────────────────────┘

Gateway：统一 API 入口，处理认证、路由、会话管理
LangGraph Server：Agent 编排引擎
Skills/Tools：可扩展的能力模块
Memory：长期记忆存储
Sandbox：隔离执行环境

实际应用场景

DeerFlow 已经超越最初的研究工具定位，社区开发者用它实现了：

📊 数据管道自动化
📽️ PPT/幻灯片自动生成
📈 数据看板搭建
📝 内容工作流自动化
🔍 深度市场调研
💻 代码生成和审查

总结

DeerFlow 2.0 代表了一个重要趋势：AI Agent 正在从"聊天"走向"干活"。

它不是又一个聊天机器人包装器，而是一个真正能让 AI 执行复杂任务的运行环境。通过沙箱隔离、多 Agent 协作、长期记忆等设计，DeerFlow 解决了传统 Agent 框架的几个关键痛点：

上下文限制：通过子 Agent 分解和上下文摘要
执行能力：通过沙箱提供真实的执行环境
记忆缺失：通过长期记忆系统跨会话学习
扩展困难：通过技能和 MCP 服务器轻松扩展

如果你正在构建 AI 应用，或者想让 AI 帮你完成实际工作，DeerFlow 绝对值得关注。

相关资源：

项目地址：https://github.com/bytedance/deer-flow
官方网站：https://deerflow.tech
中文文档：https://github.com/bytedance/deer-flow/blob/main/README_zh.md
InfoQuest 搜索工具：https://docs.byteplus.com/en/docs/InfoQuest/What_is_Info_Quest

Harness Engineering工程化教程（非常详细），AI Agent复杂长任务从入门到精通，收藏这一篇就够了！

Views are my own. “Yet Another Chapter”，Generated by Google Lyria OpenAI 的一个团队在五个月内用 Codex 写了一百万行代码，三个工程师平均每天合并 3.5 个 PR，没有一行代码是工程师手写的。Anthropic 的 Claude Code 能连续工作数天构建完整应用。LangChain 的 Coding Agent 在 Terminal Bench 2.0 上从 52.8% 跃升至 66.5%，却只改了 harness，模型没动。随着 Coding Agent 能力过去一段时间的突飞猛进，软件工程师的工作变了：从“

深度解析 MySQL 与 MCP 集成：从环境构建到 AI 驱动的数据交互全流程

前言在当前大语言模型（LLM）应用开发的浪潮中，MCP（Model Context Protocol）协议正在成为连接 AI 模型与本地数据设施的关键桥梁。本文将以 MySQL 数据库为例，详细拆解如何通过 MCP 协议让 AI 模型直接操作关系型数据库，涵盖从服务器发现、数据库架构设计、数据初始化、MCP 配置文件编写到复杂自然语言查询与写入的全过程。第一部分：MCP 服务器的发现与配置获取在进行任何数据交互之前，首要任务是确立连接协议与服务源。通过蓝耘 MCP 广场，开发者可以快速检索并获取所需的 MCP 服务器配置。在搜索栏输入 mysql 关键字，系统会立即检索出相关的 MCP 服务器资源。如下图所示，搜索结果中清晰展示了 MySQL 对应的 MCP 服务卡片。点击选中该 MCP 服务器后，

[AI提效-18]-豆包AI绘图提示词全攻略（新手可直接套用）

豆包AI绘图的核心的是“精准提示词=理想图片”，很多新手出图翻车，不是功能不好用，而是没理清提示词的核心维度，不知道每个维度该怎么描述、对应什么效果。本文将逐一拆解画风、画质、主题内容、环境、场景、色彩、灯光要求、构图、角度、图片比例10大核心要素，每个要素配“含义+示例+提示词模板”，结合完整案例详解，新手看完就能直接上手，再也不用瞎猜描述。核心原则：提示词不用长，但要“每个维度都落地”，避免模糊表述（如“好看的图”“漂亮的风景”），用具体关键词替代，让AI精准get你的需求。一、核心提示词维度详解（含示例+模板） 1. 画风（决定图片的“整体风格调性”，最基础也最关键）含义：指图片的艺术风格、绘画/拍摄流派，直接决定图片的视觉质感，是提示词的“

黄仁勋力荐：OpenClaw不止是下一个ChatGPT，更是AI“动手时代”的破局者

在2026年GTC大会上，英伟达创始人兼CEO黄仁勋抛出了一个振聋发聩的判断：“OpenClaw绝对是下一个ChatGPT”。这一评价并非夸大其词，而是精准点出了AI产业的核心演进方向——从“被动回答”的语言交互，转向“主动行动”的任务执行。ChatGPT开启了大语言模型（LLM）的普及时代，让AI具备了理解和生成人类语言的能力，但它始终停留在“军师”的角色，只能提供方案建议；而OpenClaw的出现，彻底打破了这一局限，将AI变成了能动手干活的“数字员工”，完成了AI从“认知”到“执行”的关键跃迁，成为连接AI能力与现实场景的核心桥梁。下面我将从技术本质出发，拆解OpenClaw的核心架构、关键技术实现，结合代码示例、架构图与流程图，深入解析其如何实现“行动型AI”的突破，以及为何能被黄仁勋寄予厚望，成为AI产业的下一个里程碑。一、认知跃迁：从“回答型AI”到“行动型AI”的本质区别要理解OpenClaw的价值，首先需要明确它与ChatGPT这类“回答型AI”的核心差异。

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录