DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录

10 Apr 2026 — 6 min read

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

作者：madprinter
日期：2026-03-24
项目地址：https://github.com/bytedance/deer-flow

项目介绍

DeerFlow（Deep Exploration and Efficient Research Flow）是字节跳动开源的一款超级 Agent 框架。2026 年 2 月 28 日，DeerFlow 2.0 正式发布后迅速登顶 GitHub Trending 榜首，目前已有近 40,000 颗星。

与传统的 AI 框架不同，DeerFlow 不仅仅是一个"聊天机器人"，它是一个真正能干活的 Agent 运行环境。它拥有自己的文件系统、沙箱执行环境、长期记忆系统，可以自主规划任务并调度多个子 Agent 协同工作。

为什么 DeerFlow 值得关注？

大厂背书：字节跳动出品，经过真实业务场景验证
架构先进：基于 LangGraph 和 LangChain 构建，设计优雅
功能完整：开箱即用的文件系统、记忆系统、沙箱执行
高度可扩展：支持自定义技能、工具、MCP 服务器
多模型支持：兼容 OpenAI API 格式的所有大模型

核心功能

1. 技能系统（Skills）

DeerFlow 的核心是技能系统。每个技能是一个结构化的能力模块，包含工作流程、最佳实践和相关资源引用。

内置技能包括：

🔍 深度研究（Research）
📝 报告生成（Report Generation）
📊 PPT 制作（Slide Creation）
🌐 网页生成（Web Page）
🎨 图片/视频生成（Image/Video Generation）

技能按需加载，不会一次性占用大量上下文，这对 Token 敏感的模型非常友好。

/mnt/skills/public ├── research/SKILL.md ├── report-generation/SKILL.md ├── slide-creation/SKILL.md ├── web-page/SKILL.md └── image-generation/SKILL.md

2. 子 Agent 系统（Sub-Agents）

复杂任务很少能一次完成。DeerFlow 可以将任务分解，动态生成多个子 Agent 并行执行。

每个子 Agent 有独立的作用域上下文
子 Agent 可以并行执行，提高效率
主 Agent 负责汇总所有结果，生成最终输出

例如：一个研究任务可以分解为十多个子 Agent，每个探索不同角度，最终汇聚成一份完整报告。

3. 沙箱执行环境（Sandbox）

DeerFlow 不只是"说说而已"，它有自己的"电脑"——每个任务在独立的 Docker 容器中运行：

✅ 完整的文件系统
✅ Bash 命令执行
✅ 代码运行能力
✅ 图片查看能力
✅ 会话隔离，零污染

/mnt/user-data/ ├── uploads/ # 用户上传的文件 ├── workspace/ # Agent 工作目录 └── outputs/ # 最终交付物

4. 长期记忆（Long-Term Memory）

大多数 Agent 在对话结束后就忘记一切。DeerFlow 会记住：

用户画像和偏好
技术栈信息
重复的工作流程
历史交互经验

记忆本地存储，完全由用户控制。系统会自动去重，避免重复信息无限累积。

5. 多通道集成（IM Channels）

DeerFlow 支持多种即时通讯工具接入：

通道	传输方式	难度
Telegram	Bot API (长轮询)	简单
Slack	Socket Mode	中等
飞书/Lark	WebSocket	中等

无需公网 IP，所有通道配置后即可自动启动。

6. Claude Code 集成

通过 claude-to-deerflow 技能，可以直接在 Claude Code 中与 DeerFlow 交互：

npx skills add https://github.com/bytedance/deer-flow --skill claude-to-deerflow

支持的功能：

发送任务并获取流式响应
选择执行模式：flash/fast/standard/pro/ultra
查看健康状态、模型、技能列表
管理对话线程和历史
上传文件进行分析

使用方法

快速开始

1. 克隆项目

git clone https://github.com/bytedance/deer-flow.git cd deer-flow

2. 生成配置文件

make config

这会基于模板创建本地配置文件。

3. 配置模型

编辑 config.yaml，配置至少一个模型：

models:-name: gpt-4display_name: GPT-4use: langchain_openai:ChatOpenAI model: gpt-4api_key: $OPENAI_API_KEY max_tokens:4096temperature:0.7-name: openrouter-gemini-2.5-flash display_name: Gemini 2.5 Flash (OpenRouter) use: langchain_openai:ChatOpenAI model: google/gemini-2.5-flash-preview api_key: $OPENAI_API_KEY base_url: https://openrouter.ai/api/v1

4. 设置 API Key

推荐方式：编辑项目根目录的 .env 文件

TAVILY_API_KEY=your-tavily-api-key OPENAI_API_KEY=your-openai-api-key INFOQUEST_API_KEY=your-infoquest-api-key

5. 启动服务

Docker 方式（推荐）：

make docker-init # 拉取沙箱镜像（只需一次）make docker-start # 启动服务

本地开发方式：

make check # 检查依赖makeinstall# 安装依赖make dev # 启动服务

访问：http://localhost:2026

飞书/钉钉集成示例

在 config.yaml 中配置：

channels:feishu:enabled:trueapp_id: $FEISHU_APP_ID app_secret: $FEISHU_APP_SECRET slack:enabled:truebot_token: $SLACK_BOT_TOKEN app_token: $SLACK_APP_TOKEN

在 .env 中设置对应的密钥即可。

技术架构

DeerFlow 2.0 是完全重写的版本，与 1.x 没有任何代码共享。核心架构：

┌─────────────────────────────────────────┐ │ Gateway (API Gateway) │ ├─────────────────────────────────────────┤ │ LangGraph Agent Server │ ├──────────────┬──────────────┬───────────┤ │ Skills │ Tools │ Memory │ ├──────────────┴──────────────┴───────────┤ │ Sandbox (Docker/K8s) │ └─────────────────────────────────────────┘

Gateway：统一 API 入口，处理认证、路由、会话管理
LangGraph Server：Agent 编排引擎
Skills/Tools：可扩展的能力模块
Memory：长期记忆存储
Sandbox：隔离执行环境

实际应用场景

DeerFlow 已经超越最初的研究工具定位，社区开发者用它实现了：

📊 数据管道自动化
📽️ PPT/幻灯片自动生成
📈 数据看板搭建
📝 内容工作流自动化
🔍 深度市场调研
💻 代码生成和审查

总结

DeerFlow 2.0 代表了一个重要趋势：AI Agent 正在从"聊天"走向"干活"。

它不是又一个聊天机器人包装器，而是一个真正能让 AI 执行复杂任务的运行环境。通过沙箱隔离、多 Agent 协作、长期记忆等设计，DeerFlow 解决了传统 Agent 框架的几个关键痛点：

上下文限制：通过子 Agent 分解和上下文摘要
执行能力：通过沙箱提供真实的执行环境
记忆缺失：通过长期记忆系统跨会话学习
扩展困难：通过技能和 MCP 服务器轻松扩展

如果你正在构建 AI 应用，或者想让 AI 帮你完成实际工作，DeerFlow 绝对值得关注。

相关资源：

项目地址：https://github.com/bytedance/deer-flow
官方网站：https://deerflow.tech
中文文档：https://github.com/bytedance/deer-flow/blob/main/README_zh.md
InfoQuest 搜索工具：https://docs.byteplus.com/en/docs/InfoQuest/What_is_Info_Quest

一键换装魔法：基于ComfyUI工作流的Stable Diffusion服装替换指南

文章目录 * 一、Stable Diffusion与ComfyUI工作流基础 * 二、工作流获取：从社区到管理器一键部署 * 途径1：专业工作流社区（推荐新手） * 途径2：ComfyUI Manager（高阶扩展） * 三、换装工作流详解：以ComfyUI为例 * 工作流结构拆解 * 关键节点说明 * 模型准备清单 * 四、实战演示：一键换衣全流程 * 五、进阶应用：跨次元换装与3D生成 * 六、常见问题排查 * 结语：工作流的未来 Stable Diffusion作为当前最热门的开源文生图模型，在图像生成领域掀起了一场革命。其最新版本Stable Diffusion 3 Medium（2024年发布）包含20亿参数，在图像质量、复杂提示理解及资源效率方面实现显著突破，能生成细节逼真、色彩鲜艳且光照自然的图像。而ComfyUI作为基于节点的工作流界面，通过可视化连接处理模块，为复杂任务（如图像重绘、视频生成、服装替换等）提供了灵活且可复现的解决方案。

CosyVoice环境安装报错：安装openai-whisper时出现ModuleNotFoundError: No module named ‘pkg_resources‘的原因

先说如何解决，我个人采用源码安装，安装时禁用构建隔离： git clone https://github.com/openai/whisper.git cd whisper git checkout v20231117 pip install -e . --no-build-isolation 再说该问题产生的原因，下面是大D老师的回答，自行参考。太棒了！你找到了正确的解决方案。让我详细解释为什么会出现这个问题，以及为什么 --no-build-isolation 能解决它。 🔍 问题根源分析问题的关键在于 PEP 517/518 构建隔离机制和你的 setup.py 实现方式。 1. 构建隔离机制 (Build Isolation) 的工作原理当你执行 pip install -e .（不带 --no-build-isolation）时，

高级java每日一道面试题-2025年7月15日-基础篇[LangChain4j]-如何集成国产大模型（如通义千问、文心一言、智谱 AI）？

你想了解在LangChain4j中如何集成主流的国产大模型（通义千问、文心一言、智谱AI），并希望得到面向高级面试的详细解答。这是LangChain4j落地国内场景的核心考点，既考察对框架扩展能力的理解，也考察对国产模型生态的熟悉度。一、核心原理：国产模型集成的通用逻辑 LangChain4j对国产大模型的集成，核心遵循「统一接口 + 专属适配器」的设计： 1. 所有模型均实现LangChain4j的ChatLanguageModel/EmbeddingModel核心接口，保证调用方式一致； 2. 每个国产模型有专属的集成依赖（如langchain4j-dashscope对应通义千问）； 3. 配置上需适配国产模型的专属参数（如阿里云AccessKey、百度API Key/Secret Key）。二、完整集成实现（通义千问 + 文心一言 + 智谱AI）以下是可直接运行的生产级代码，覆盖三大主流国产模型的集成，包含基础调用、参数配置、异常处理等核心要点。 1. 前置依赖（Maven）首先引入各模型的专属集成依赖（按需选择）： <dependencies><!

FireRedASR-AED-L效果实测：对比Whisper-v3与Qwen2-Audio，中文方言识别胜出23%

FireRedASR-AED-L效果实测：对比Whisper-v3与Qwen2-Audio，中文方言识别胜出23% 1. 项目背景与核心能力 FireRedASR-AED-L是一款基于1.1B参数大模型开发的本地语音识别工具，专为解决中文、方言及中英混合语音识别场景中的实际问题而设计。与需要云端服务的语音识别方案不同，这款工具完全在本地运行，无需网络连接，特别适合对数据隐私有严格要求的企业和个人用户。该工具的核心技术创新点包括： * 自动环境装配：一键解决PyTorch版本适配、CUDA环境配置等传统部署难题 * 智能音频预处理：自动将各种格式的音频转换为模型要求的16k 16-bit PCM格式 * 自适应推理引擎：根据硬件条件自动选择GPU加速或CPU模式 * 工业级识别精度：针对中文方言和中英混合场景进行专项优化 2. 实测环境与方法 2.1 测试环境配置本次对比测试在以下硬件环境下进行： * CPU：Intel i9-13900K * GPU：NVIDIA RTX 4090 (24GB显存) * 内存：64GB DDR5 * 操作系统：U

DeerFlow 2.0：字节开源的超级 Agent 框架，让 AI 真正干活

优质文章学习记录