news-bot 开源项目:自动化科研与技术热点日报机器人
随着信息爆炸时代的到来,每天面对海量科技新闻、学术进展与博客更新,手动查看各种渠道已不现实。news-bot 是一个开源项目,旨在自动化爬取与推送每日新闻,帮助用户轻松掌握最新科研与技术动态。
项目简介
news-bot 的核心功能包括:
- 每天按计划运行,自动爬取多来源新闻与技术动态
- 多源聚合信息(如 arXiv、技术博客、Hacker News 等)
- 结构化输出日报(Markdown 文件,包含标题、来源、摘要)
- AI 自动摘要支持(可配置大语言模型生成当天简要总结)
- 基于 GitHub Actions 的自动化工作流,无需手动部署或后台服务器
它本质上是一个私人、高质量、自动化的科研与技术资讯助手。
项目架构
项目关键结构如下:
news-bot/
├── .github/
│ └── workflows/daily.yml # 定时触发 GitHub Actions
├── scripts/
│ ├── fetch-rss.js # 抓取 RSS / 源数据
│ ├── sources.js # 配置新闻源列表
│ ├── generate-md.js # 生成 Markdown 日报
│ ├── generate-summary.js # 可选 LLM 自动摘要
│ └── run.js # 整体执行流程入口
├── daily/
│ └── .gitkeep # 日报输出文件夹
└── package.json
项目通过 GitHub Actions 定时触发,在每天固定时间运行抓取脚本,然后输出当日总结。
核心功能
多源新闻聚合
通过预置的 RSS / 博客源列表,news-bot 能自动抓取来自科研、AI、大模型、Agent、RAG、系统架构等多个方向的最新动态。
| 类别 | 信息源 |
|---|---|
| AI / LLM | arXiv、OpenAI Blog |
| Agent / 智能体 | Google News |
| 技术社区 | Hacker News、GitHub Blog |
| 系统编程 | Rust Blog |
你也可以自行编辑
scripts/sources.js,添加自己喜欢的 RSS 或 JSON 新闻源!
AI 自动摘要
如果配置了 LLM API Key(如硅基流动),bot 会基于模型为每日报告生成自然语言摘要,总结一天最值得关注的技术趋势与进展。
示例输出:
## 今日总结
1. 大模型性能突破:多个研究团队发布了更高效架构与训练技巧...
2. RAG 模型优化:检索增强生成在实际应用中取得显著效果...
3. 智能体生态完善:多代理框架与工具链日渐成熟...
自动化部署
项目使用 .github/workflows/daily.yml 来安排任务,例如:
- 每天 UTC+8 09:00 & 21:00 自动运行

