Bright Data亮数据 MCP + N8N x AI 新闻编辑:基于亮数据,数据采集到观点摘要工作流自动化实践

Bright Data亮数据 MCP + N8N x AI 新闻编辑:基于亮数据,数据采集到观点摘要工作流自动化实践

Bright Data亮数据 MCP + N8N x AI 新闻编辑:基于亮数据,数据采集到观点摘要工作流自动化实践

背景

在这里插入图片描述
大模型与智能体技术高速发展的当下,垂直领域智能体成为企业智能化转型的新宠,如招聘助手、电商导购等场景应用层出不穷。然而,数据来源的非结构化、不可控与滞后性,制约着智能体的精准性与时效性,成为开发者面临核心难题,Bright Data MCP 作为创新型"即插即用"数据解决方案,通过先进数据采集与处理技术,深度覆盖招聘、电商、金融等多个行业领域,能够自动抓取网页数据并进行结构化处理,将零散无序的信息转化为规范、有序的知识单元,无论是搭建智能体的核心知识库,还是为对话交互构建上下文语料库,MCP 都能以高效、合规的方式,提供实时、精准的数据支撑,帮助开发者大幅降低数据处理成本,攻克数据获取难题,从而将更多精力聚焦于智能体的功能优化与应用创新,加速智能体的开发与落地进程。

Bright Data MCP介绍

在这里插入图片描述
Bright Data MCP 以一站式解决方案助力 AI 模型与代理实时高效获取公共 Web 数据,无论是静态文本还是动态加载内容均可精准抓取,无需开发者自建复杂爬虫架构或攻克反爬技术壁垒,通过集成化的技术架构与智能调度系统,让 AI 轻松突破数据获取技术瓶颈

即插即用零代码部署:标准化接口设计,无需搭建复杂爬虫框架或编写反反爬代码,通过简单配置即可接入全球网页数据源

动态数据全链路解析:针对现代网页普遍采用 JavaScript 渲染、动态加载技术,MCP 内置智能解析引擎,自动识别页面元素变化规律,精准抓取实时价格、评论更新等动态内容

超规模稳定网络支撑:依托 7200 万个 IP、覆盖 195 个国家的商用代理网络,MCP 可实现每秒 17 万次请求的高并发采集,每日处理 1PB 级网络流量,同时保持 99.99% 的系统可用性

合规安全智能防护:通过内置 AI 反指纹技术,MCP 自动模拟真实用户行为,规避网站反爬机制;数据传输全程采用 TLS 加密,严格遵循 GDPR、CCPA 等国际数据法规,为企业数据安全与合规运营提供双重保障

N8N工作流自动化工具

在这里插入图片描述
N8N 工作流自动化工具与 Bright Data MCP 搭配,能发挥强大协同优势,N8N 可视化无代码特性,可轻松将 Bright Data MCP 采集的多源 Web 数据接入工作流,快速完成数据清洗、分类与格式转换,既降低技术门槛,又实现数据采集与处理的全流程自动化,大幅提升 Web 数据应用效率

✅可视化无代码工作流构建:拖拽式节点编辑器可视化搭建自动化流程,零代码连接 400 + 应用,支持触发节点、操作节点、逻辑节点自由组合,搭积木实现跨平台数据自动化流转

开源自托管与高扩展性:采用公平代码许可,支持本地部署或云端运行,完全掌控数据隐私,提供自定义节点开发接口,可集成任意 REST API 服务

AI 赋能的智能自动化:内建 LangChain 支持构建 AI Agent 工作流,通过自然语言指令生成流程,AI 自动推荐节点组合、修复运行错误,支持接入私有大模型,实现文本摘要、情感分析等智能任务与业务流程的无缝融合

前提准备

Bright Data MCP 注册
1、Bright Data MCP 官网注册



2、注册



3、邮箱、谷歌、Github注册



3、注册成功即可成功访问Bright Data

DeepSeek API与新闻 API 获取
Gnews API
读者需要提前注册 Gnews 账户获取 Gnews API 用于N8N工作流搭建
在这里插入图片描述
News API
读者需要提前注册 News 账户获取 News API 用于N8N工作流搭建
在这里插入图片描述
DeepSeek API
读者需要提前注册 DeepSeek 账户获取 DeepSeek API 用于N8N工作流搭建
在这里插入图片描述

Bright Data MCP + N8N x AI 新闻编辑

分析
📰新闻聚合与观点摘要助手:打造你的 AI 新闻编辑

🌟场景说明: 使用 Bright Data MCP采集 Google News 新闻类数据,构建一个能自动聚合新闻并生成摘要自动化工作流

✨可用技术:DeepSeek + Bright Data MCP+ N8N工作流

✨亮点: 多源聚合 + 自动摘要 + 自动化任务
准备工作
Bright Data配置
1、Bright Data API 密钥获取Bright Data官网-账户设置中获取自己的 API 密钥(注意将权限从用户调整为管理员,保存自己密钥用于后续搭建N8N工作流)



2、Bright Data 网络爬虫程序创建Web 数据集-数据集市场

搜索Goole News

点击发现

Google 新闻 - 按 URL 收集

选用抓取器 API(使用此 API 启动具有指定参数的数据收集并返回结果)

创建成功

N8N社区节点 Bright Data Mcp 配置
1、N8N社区节点 Bright Data Mcp 配置



2、点击设置



3、开启N8N社区节点直接,用于后续在N8N工作流中配置Bright Data Mcp社区节点



4、N8N用户控制台创建工作流



5、节点搜索 Bright Data,能够出现 Bright Data Mcp 社区节点,即说明成功配置N8N社区节点支持

Bright Data MCP + N8N 智能体搭建
1、选择定时触发节点 On a schedule 作为第一个节点,并且配置

配置 On a schedule 规制为每天早上8点执行一次,Execute step 测试验证节点正确性

如下则表示节点成功执行



2、Http Request 节点创建并且配置

Http Request 配置Method:GetURL:填入 Gnews API



3、再拉一个 Http Request 节点创建并且配置

Http Request 配置Method:GetURL:填入News API(同样将url中q=example换成q=ai)



4、字段转换节点 Edit Fields(Set)添加

Edit Fields(Set)配置,点击 Execute step 将 articles 拖入 Add Field 再次点击 Execute step



5、添加 Merge 节点合并 News 和 Gnews 数据源

Merge 配置Mode:AppendNumber of Inputs:2



6、配置第三个并行的 Http Request Post节点用于触发 Bright Data MCP 数据收集 APIBright Data 控制台页面复制获取到的 cUrl

直接在 Http Request 节点 Import cURL 即可完成配置点击节点Execute step 测试,成功后右侧会出现 snapshot_id(后面通过 snapshot_id 来获取数据)



7、添加等待 Wait 节点(因为 Bright Data 采集数据需要时间所以需要等待1分钟之后再执行,避免传出空值)

Wait 配置,配置1分钟即可



8、配置 Http Request Get节点用于 Bright Data MCP 数据获取 Download snapshot管理API-下载快照ID填写前面节点获取到的 snapshot_id,复制cURL

Http Request Get节点 Import cURL 即可完成配置



9、Limit 节点用户筛选数据,避免数据过多

Max Items:100Keep:First Items



10、字段转换节点 Edit Fields(Set)添加配置(拼接title和url用逗号分隔)



11、AI Agent 大模型节点配置Source for Prompt (User Message):Define belowPrompt (User Message)



12、DeepSeek 节点配置Creat New Credential

DeepSeek API 令牌配置



13、AI Agent 大模型成功配置

执行成功可以看到 Bright Data 有抓取任务执行完成



14、如果有其他需求可以额外配置Tg或者Email来执行定时群发任务,AI新闻编辑实现定时群发功能Tg配置

Tg Token配置


15、完整工作流节点展示

16、执行工作流即可在Tg看到AI编辑机器人群发一条新闻消息,至此一个Bright Data MCP + N8N 工作流 AI 智能新闻编辑智能体就搭建完成了

N8N工作流配置文件分享
如下是我搭建的AI_News_Editor.json配置文件,如果搭建想要实操可以直接导入修改相关配置,即可和博主一样搭建起来同样的智能体工作流

总结

Bright Data MCP 通过"技术封装 + 流程自动化 + 合规托管"三重能力,不需要开发者搭建爬虫架构与处理反爬、动态解析等技术难题,搭配 N8N 可视化工作流实现从多源新闻数据采集、合并到 AI 摘要生成全流程自动化,帮助开发者大幅降低数据处理成本,将精力聚焦于 AI 模型优化与业务创新,加速智能体开发落地。如果大家想要和我一样自主搭建工作流智能体学习,或者企业工作流智能体落地,可以注册Bright Data 亮数据和我一起搭建学习与项目落地!

Read more

【Web APIs】JavaScript touch 触摸事件 ① ( touchstart 触摸开始事件 | touchmove 触摸移动事件 | touchend 触摸结束事件 )

【Web APIs】JavaScript touch 触摸事件 ① ( touchstart 触摸开始事件 | touchmove 触摸移动事件 | touchend 触摸结束事件 )

文章目录 * 一、JavaScript touch 触摸事件 * 1、 touchstart 触摸开始事件 * 2、touchmove 触摸移动事件 * 3、touchend 触摸结束事件 * 二、代码示例 - touch 触摸事件 * 1、代码示例 * 2、执行结果 一、JavaScript touch 触摸事件 touchstart、touchmove、touchend 事件是 JavaScript 专为支持 触摸操作 的 移动设备( 手机、平板等 ) 设计的核心触摸事件, 用于 监听用户的触摸行为 , 构成了 完整的 触摸生命周期 ; 1、 touchstart 触摸开始事件 touchstart 触摸开始事件 : * 核心定义

Qwen3-VL-WEBUI移动端集成:App调用API部署教程

Qwen3-VL-WEBUI移动端集成:App调用API部署教程 1. 引言 1.1 业务场景描述 随着多模态大模型在移动端应用的不断拓展,如何将强大的视觉-语言模型(VLM)能力无缝集成到移动 App 中,成为智能客服、图像理解、自动化操作等场景的关键技术挑战。传统方案往往依赖云端纯文本推理,难以满足对图像、视频内容实时理解与交互的需求。 Qwen3-VL-WEBUI 的出现为这一问题提供了高效解决方案。它不仅集成了阿里最新开源的 Qwen3-VL-4B-Instruct 模型,还内置了完整的 Web API 接口服务,支持通过 HTTP 调用实现图文输入、结构化输出,非常适合移动端 App 快速接入。 1.2 痛点分析 目前移动端集成 VLM 面临三大核心痛点: * 部署复杂:多数模型需自行搭建推理环境,配置 CUDA、PyTorch、Transformers 等组件,门槛高。 * 接口缺失:

AI Agent Skill Day 12:Web Search技能:互联网搜索与信息聚合

【AI Agent Skill Day 12】Web Search技能:互联网搜索与信息聚合 在“AI Agent Skill技能开发实战”系列的第12天,我们聚焦于Web Search技能——这一使Agent具备实时获取互联网公开信息能力的核心模块。随着大模型知识存在时效性限制(如训练数据截止至2023年或2024年),仅依赖内部知识库难以应对动态世界中的最新事件、股价、新闻、产品发布等需求。Web Search技能通过集成搜索引擎API(如SerpAPI、Google Programmable Search Engine、DuckDuckGo等),实现对网络信息的精准检索、结果聚合与语义提炼,是构建“活Agent”的关键一环。本技能广泛应用于智能客服、市场情报分析、科研辅助、金融舆情监控等场景,显著提升Agent的信息鲜度与决策质量。 技能概述 Web Search技能是指AI Agent在接收到用户查询后,自动调用外部搜索引擎接口,获取相关网页摘要、链接及结构化信息,并将结果进行清洗、去重、排序和语义压缩后返回给大模型,

实战:手写一个通用Web层鉴权注解,解决水平权限漏洞

实战:手写一个通用Web层鉴权注解,解决水平权限漏洞

实战:手写一个通用Web层鉴权注解,解决水平权限漏洞 * 一、背景:一次渗透测试引发的改造 * 二、需求分析:如何高效修复 * 三、业务模型:用户-公司授权关系 * 四、整体架构设计 * 五、代码实现:一步一步来 * 5.1 注解定义 * 5.2 权限管理服务 * 5.3 AOP切面:核心逻辑 * 六、使用示例 * 6.1 场景1:最简单的用法 * 6.2 场景2:对象属性 * 6.3 场景3:批量操作 * 6.4 场景4:嵌套属性 * 6.5 场景5:类级别默认配置 * 七、