DeerFlow 2.0开源

DeerFlow 2.0开源

目录

从研究工具到超级智能体

什么是 DeerFlow?

核心特性

技能系统

子智能体

沙盒与文件系统

上下文工程

长期记忆

技术架构

快速开始

推荐模型

应用场景

项目现状

总结


2026 年 2 月 28 日,一款来自字节跳动的开源项目登顶 GitHub Trending 榜首。

它叫 DeerFlow,一个超级智能体架构,短时间就拿了 2.2 万 Star。

说实话,刚看到这个项目的时候,我还有些疑惑——又一个 AI Agent 框架?但深入了解后,我发现这玩意儿确实不一样。

从研究工具到超级智能体

DeerFlow 的故事挺有意思。

最开始,它只是个深度研究框架。但开发者们把它用出了各种花样:构建数据管道、生成幻灯片、搭建仪表盘、自动化内容工作流……这些都是团队最初没想到的。

团队这才意识到:DeerFlow 不只是个研究工具,它是一个架构——一个让智能体真正能够完成工作的运行环境。

于是他们从零重写,推出了 DeerFlow 2.0。

什么是 DeerFlow?

通俗地说,DeerFlow 是个超级智能体套件,它可以让 AI 帮你做几乎所有事情。

它通过编排子智能体、记忆系统和沙盒环境,来处理那些可能需要几分钟到几小时才能完成的复杂任务。

基于 LangGraph 和 LangChain 构建,DeerFlow 开箱即用地提供了智能体所需的一切:文件系统、记忆、技能、沙盒执行环境,以及规划和生成子智能体来完成复杂多步任务的能力。

核心特性

技能系统

这是 DeerFlow 最核心的特点。

技能是个结构化的能力模块——一个 Markdown 文件,定义了工作流程、最佳实践和参考资源。

DeerFlow 内置了研究、报告生成、幻灯片创建、网页开发、图片视频生成等技能。但厉害的地方在于可扩展性:你可以添加自己的技能,替换内置的,或者组合成复合工作流。

技能是按需加载的——只有当任务需要时才加载,不会一次性全部加载。这保持了一个精简的上下文窗口,让 DeerFlow 即使对 token 敏感的模型也能良好工作。

子智能体

复杂的任务很少能一次完成。DeerFlow 会把它们分解。

主导智能体可以即时生成子智能体——每个都有自己的上下文、工具和终止条件。子智能体尽可能并行运行,报告结构化结果,然后主导智能体将所有内容综合成连贯的输出。

一个研究任务可能会派生出十几个子智能体,每个探索不同的角度,然后汇聚成单一报告——或者网站——或者带有生成视觉效果的幻灯片。

一个套件,多只手。

沙盒与文件系统

DeerFlow 不只是谈论做事。它有自己的电脑。

每个任务都在一个独立的 Docker 容器中运行,拥有完整的文件系统——技能、工作空间、上传、输出。智能体可以读取、写入和编辑文件,执行 bash 命令和代码,查看图像。全部沙盒化,全部可审计,会话之间零污染。

这就是带有工具访问权限的聊天机器人和拥有实际执行环境的智能体之间的区别。

上下文工程

DeerFlow 对上下文管理很激进——总结已完成的子任务,将中间结果卸载到文件系统,压缩不再立即相关的内容。这让它能够在长、多步骤的任务中保持敏锐,而不会撑爆上下文窗口。

长期记忆

大多数智能体在对话结束的那一刻就会忘记一切。DeerFlow 记住。

在会话之间,DeerFlow 会建立关于你的档案、偏好和积累知识的持久记忆。你用得越多,它就越了解你——你的写作风格、你的技术栈、你的重复工作流程。记忆存储在本地,完全由你控制。

技术架构

DeerFlow 2.0 是从零重写的,与 v1 没有共享任何代码。如果你在寻找原始的深度研究框架,它仍在 1.x 分支上维护。

基于 LangGraph 和 LangChain,DeerFlow 支持多种沙盒执行模式:

  • • 本地执行(直接在主机上运行沙盒代码)
  • • Docker 执行(在独立的 Docker 容器中运行)
  • • 带 Kubernetes 的 Docker 执行(通过 provisioner 服务在 Kubernetes pod 中运行)

快速开始

推荐使用 Docker 方式:

# 克隆仓库 git clone https://github.com/bytedance/deer-flow.git cd deer-flow # 生成配置文件 make config # 编辑 config.yaml 配置你的模型 # 至少配置一个模型,例如 GPT-4 # 启动服务 make docker-init    # 拉取沙盒镜像(只需一次) make docker-start   # 启动服务 # 访问 http://localhost:2026

也支持本地开发模式:

make check  # 检查前置条件 make dev    # 启动开发服务

推荐模型

DeerFlow 是模型无关的——适用于任何实现 OpenAI 兼容 API 的 LLM。但它在支持以下功能的模型上表现最佳:

  • • 长上下文窗口(100k+ tokens)用于深度研究和多步骤任务
  • • 推理能力用于自适应规划和复杂分解
  • • 多模态输入用于图像理解和视频理解
  • • 强大的工具使用用于可靠的函数调用和结构化输出

应用场景

深度研究:派发多个子智能体并行研究不同角度,然后综合成完整报告。

内容创作:从研究到报告、幻灯片、网页,一站式完成。

数据管道:自动化数据处理、分析和可视化流程。

工作流自动化:将重复性工作交给智能体处理。

项目现状

DeerFlow 采用 MIT 许可证,可以自由使用和修改。项目很活跃,欢迎社区贡献。

核心团队来自字节跳动,主要贡献者包括 Daniel Walnut 和 Henry Li。

总结

DeerFlow 的出现,标志着 AI Agent 领域迈出了重要一步。

它不只是个框架,而是一个完整的智能体运行环境——一个让 AI 真正能够"做事"的平台。

从研究工具到超级智能体架构,DeerFlow 的进化反映了一个重要趋势:我们需要的不是更会聊天的 AI,而是更能干活的 AI。

如果你也在寻找一个真正能帮你完成复杂任务的 AI 智能体,DeerFlow 值得一试。

GitHub 项目地址:https://github.com/bytedance/deer-flow

今天的分享到此结束,感谢大家抽空阅读,我们下期再见!

Read more

永久开源免费用!科哥打造的OCR文字检测工具推荐

永久开源免费用!科哥打造的OCR文字检测工具推荐 一款真正开箱即用、无需配置、不收一分钱的OCR文字检测WebUI工具——它不只是一段代码,而是一个完整可交付的生产力解决方案。本文将带你从零开始,快速上手这款由科哥独立开发、持续维护的cv_resnet18_ocr-detection镜像,并深入理解它在真实工作流中能为你省下多少时间。 1. 为什么你需要这个OCR工具? 你是否也经历过这些时刻: * 扫描合同后想快速提取条款,却要反复截图、粘贴、校对; * 整理上百张发票照片,手动录入金额和日期,一坐就是半天; * 做竞品分析时,看到对手宣传页上的关键数据,却没法一键复制; * 学生党整理课堂PPT截图,逐张打字转文字,效率低到怀疑人生。 市面上的OCR服务,要么按次收费、要么限制调用量、要么需要注册企业资质、要么部署复杂得像在搭火箭。而今天介绍的这款工具,没有试用期、没有水印、不联网上传、不依赖云服务、不强制绑定账号——它就安静地运行在你的服务器或本地机器上,点开浏览器就能用。 更关键的是:它不是简单套壳,而是基于ResNet18主干网络+优化检测头的轻量级OC

By Ne0inhk
深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验

深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验

文章目录 * 🔍 深度评测 GLM-5:AtomGit 首发模型的代码生成实战体验 * 📋 前言 * 🏗️ 一、模型参数配置 * ⚡ 二、核心能力实测:Flask API 完整服务生成 * 2.1 测试任务 * 2.2 模型输出分析 * 2.3 项目结构输出 * 2.4 核心代码质量评测 * 配置文件 (config.py) * 用户模型 (models/user.py) * 错误处理 (utils/errors.py) * 数据验证 (utils/validators.py) * 📊 三、性能表现评估 * 💡 四、使用技巧与建议 * 4.1 提示词优化技巧 * 4.2 参数调优建议

By Ne0inhk
GitHub Copilot 调用第三方模型API

GitHub Copilot 调用第三方模型API

一、说明 OAI Compatible Provider for Copilot 的作用是:把 Copilot/Copilot Chat 发出的“类似 OpenAI API 的请求”,转发到指定的 OpenAI-Compatible 服务端(例如 ModelScope 推理网关、自建的兼容网关等)。 ⚠️ Warning 登录 GitHub Copilot 的账号一定要是非组织方式开通 pro 会员的,不然无法管理模型。 推荐直接用免费的free账号登录即可。 二、插件安装 在 VS Code 扩展市场安装并启用: * GitHub Copilot * GitHub Copilot Chat * OAI Compatible Provider for Copilot (johnny-zhao.

By Ne0inhk

dify平台集成OCR:低代码+AI模型打造智能表单识别系统

dify平台集成OCR:低代码+AI模型打造智能表单识别系统 📖 项目背景与技术选型动因 在企业数字化转型过程中,大量纸质表单、发票、合同等非结构化文档需要转化为可处理的结构化数据。传统人工录入方式效率低、成本高、易出错,而通用OCR服务往往对中文支持不完善,尤其在复杂背景或手写体场景下识别准确率骤降。 为此,我们基于 dify 低代码平台,集成了一套轻量级但高精度的 OCR 文字识别系统。该系统采用经典的 CRNN(Convolutional Recurrent Neural Network)模型架构,专为中英文混合文本识别优化,在无GPU依赖的前提下实现 <1秒 的平均响应时间,真正做到了“开箱即用”的工业级OCR能力。 本方案的核心价值在于: - 低代码集成:通过dify平台快速接入AI能力,无需深度开发即可构建智能表单应用 - 高识别精度:相比传统轻量模型,CRNN在中文长文本、模糊图像、倾斜排版等复杂场景下表现更优 - 双模输出支持:同时提供可视化Web界面和标准REST API,

By Ne0inhk