用Dify搭建多平台热点聚合与自动摘要生成流水线
信息太分散了——掘金、B站、微博、今日头条,每天想快速了解热点,手动整理不仅累,还容易遗漏。我索性搭了一套自动化的东西,用 Dify 把数据抓取、解析、聚合、模型生成摘要一条龙做完,最后输出 Markdown 和 PDF。这篇文章记录一下完整过程,你如果有类似需求,可以直接拿去改。
整体流程是这样的:

数据采集 → 平台解析器(统一格式) → 变量聚合器 → LLM 分析生成 → Markdown 转 PDF / 返回用户。
拆解开看,就是在流程里把'多平台差异'和'模型能力'解耦,每个节点只做一件事,扩展起来也方便。
下面是一个输出示例:

环境准备
在 Dify Studio 里,需要先安装三个插件(顺序无所谓):
- rookie_rss(或者你惯用的 RSS 抓取器)
- OpenAI-API-compatible(对接兼容 OpenAI 接口的模型服务)
- Markdown 转换器(把 Markdown 输出转成 PDF)
装完在'已安装'列表里确认一下。

创建空白应用
- 进 Studio,底部点'创建空白应用'。
- 拉一个'数据输入'节点(可以是 RSS、HTTP 或 webhook)。
- 加一个'条件分支'节点,然后根据平台连到不同的解析执行器(也可以共用一个)。

条件分支
条件分支就是根据 platform 字段决定走哪条路:"juejin", "bilibili", "weibo",或者直接 "all"。每个分支把 arg1(原始 JSON)丢给对应脚本。
设计上,尽量把平台差异封在解析层里,工作流节点保持薄而专注,方便以后加新平台。

平台解析器
这里我用 Python 写了一个可复用的解析脚本,放进 Dify 的'脚本执行'节点就行。输入可以是 JSON 字符串、字典或列表,自动提取 列表,输出统一表格:标题、热度、手机/PC 链接、更新时间。时间解析支持 ISO8601(带不带毫秒都行)和时间戳(秒或毫秒),最后统一转成上海时间(UTC+8)。







