我让openclaw做了一个 B 站弹幕分析SKILL：自动抓取 + 词云 + 情感分析 + 舆情报告（开源）

Ne0inhk

21 Mar 2026 — 4 min read

大家好，最近我让openclaw把我自己在内容运营里常用的一套“弹幕分析流程”做成了一个可复用的小项目：

👉 bilibili-danmaku
GitHub：https://github.com/Smartloe/bilibili-danmaku

核心目标很直接：

给我一个 B 站视频链接
自动抓取弹幕
自动做分词清洗
自动输出词云图 + 情感分析 + 舆情报告

适合做内容复盘、热点观察、用户反馈提炼。

一、这个项目解决了什么问题？

日常做视频复盘时，常见痛点是：

弹幕采集麻烦：每次手动导出/复制，效率很低。
词云质量不稳定：不清洗会被“哈哈哈/666/这边那边”污染。
舆情判断缺标准：没有统一口径，沟通时容易“拍脑袋”。

这个项目把整条链路打通了：

抓取 → 清洗 → 关键词 → 词云 → 情感 → 报告

二、功能特性

✅ 自动解析 BVID -> CID，抓取弹幕 XML
✅ 导出结构化数据：CSV / JSON / TXT
✅ jieba 分词 + 干扰词清洗
✅ SnowNLP 情感分析（正/中/负分布）
✅ wordcloud 生成高密度中文词云 PNG
✅ 自动生成 Markdown 舆情报告

三、项目结构

bilibili-danmaku/ ├── SKILL.md ├── README.md ├── README.en.md ├── requirements.txt ├── scripts/ │ ├── ensure_env.sh │ ├── fetch_danmaku.py │ ├── fetch.sh │ ├── analyze_danmaku.py │ └── analyze.sh ├── references/ │ ├── methodology.md │ └── stopwords.default.txt └── output/

四、在 OpenClaw 里一键使用（推荐）

如果你本身就在用 OpenClaw，最省事的方式是直接从 ClawHub 安装：

clawhub install bilibili-danmaku

安装后开启一个新的 OpenClaw 会话，直接给视频链接即可调用技能完成：

弹幕抓取
词云生成
情感分析
舆情报告输出

五、源码方式（3 步）

1）安装依赖

cd bilibili-danmaku bash scripts/ensure_env.sh

2）抓取弹幕

python3 scripts/fetch_danmaku.py \--url"https://www.bilibili.com/video/BV17JfuBqEqg"\--outdir"./output"

支持短链：

python3 scripts/fetch_danmaku.py --url"https://b23.tv/gO0nMGs"--outdir"./output"

3）分析并出报告

bash scripts/analyze.sh \"./output/<xxx>_danmaku.csv"\"./output/<xxx>_meta.json"\"./output"\"task_name"

输出文件：

task_name_top_words.json
task_name_sentiment.json
task_name_wordcloud.png
task_name_report.md

六、为什么这版词云更“干净”？

我在分词后做了数据清洗，重点是四件事：

停用词过滤：默认词表 + 自定义词表
噪声词过滤：比如 哈哈哈 / 233 / 666 / 纯符号
token 规范化：别名合并、重复字符压缩
高文档频率短词剔除：去掉“出现太广但信息量低”的词

你还可以临时追加干扰词：

./.venv/bin/python scripts/analyze_danmaku.py \--csv"./output/<xxx>_danmaku.csv"\--meta"./output/<xxx>_meta.json"\--outdir"./output"\--name"task_clean"\ --extra-stopwords "妈妈,亲戚,那边,这边"

七、情感分析怎么做？

使用 SnowNLP，每条弹幕都会得到一个 0~1 的情绪分：

>= 0.60：positive
<= 0.40：negative
中间：neutral

最后汇总成：

正向/中性/负向占比
平均情绪分
代表性正负样本

这对“选题复盘”和“评论区风向判断”很实用。

八、适用场景

内容运营：复盘某条视频的用户反馈
新媒体团队：快速形成“可汇报”的舆情材料
创作者：看粉丝关注点与争议点
数据分析同学：做多视频横向对比

九、我自己的使用建议

如果你要把它用于日常工作流，我建议：

先跑单视频，确认数据链路与参数
再跑批量视频，做横向对比
维护一个自己的 stopwords 词表（按垂类持续迭代）
报告里优先看三件事：
- 情绪结构是否异常
- 高频词是否偏离内容定位
- 负向样本是否集中在某个可改进点

十、开源地址

如果你刚好也在做内容分析，欢迎直接拿去用：

🔗 GitHub：https://github.com/Smartloe/bilibili-danmaku

欢迎提 issue / PR，一起把它打磨成更顺手的中文内容分析工具。🚀

十一、免责声明

请遵守 B站平台规则与相关法律法规。
本项目仅用于公开数据分析与研究，不用于违规抓取和滥用。

【Linux指南】进程控制系列（二）进程终止 —— 退出场景、方法与退出码详解

文章目录 * 一、先想明白：进程终止不是 “消失”，而是 “释放资源” * 二、进程退出的三大场景：正常与异常的边界 * 场景 1：正常退出（代码执行完毕，结果正确） * 场景 2：正常退出（代码执行完毕，结果不正确） * 场景 3：异常退出（代码崩溃，被迫终止） * 三、三种进程退出方法：return、exit、_exit 的核心差异 * 3.1 方法 1：return—— 仅在 main 函数中有效 * 核心逻辑： * 3.2 方法 2：exit 函数 —— 带清理操作的库函数退出 * 核心逻辑与清理操作： * 函数原型： * 3.

Flutter 三方库 system_settings 的鸿蒙化适配指南 - 实现应用内直达系统深度配置、支持通知权限、显示、声音与开发者选项一键跳转

欢迎加入开源鸿蒙跨平台社区：https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 system_settings 的鸿蒙化适配指南 - 实现应用内直达系统深度配置、支持通知权限、显示、声音与开发者选项一键跳转前言在进行 Flutter for OpenHarmony 的精细化应用开发中，引导用户去开启必要的系统权限（如允许通知、修改屏幕自动旋转）是保障应用功能完整性的重要环。system_settings 是一个专注于将复杂的系统跳转 URI 语义化的库。它能让你的代码更具可读性，快速触达鸿蒙系统的各类深度设置页面。本文将指导大家如何在鸿蒙真机上实现高效率的跳转逻辑。一、原理解析 / 概念介绍 1.1 基础原理 system_settings 的核心是利用鸿蒙系统的 Want 启动机制。它预置了大量标准化的设置页面标识符，通过简单的 MethodChannel 调用，请求鸿蒙的 AbilityContext

【Linux】Linux基本使用和程序部署

🎬 那我掉的头发算什么：个人主页 🔥 个人专栏: 《javaSE》《数据结构》《数据库》《javaEE》 ⛺️待到苦尽甘来日文章目录 * Linux环境搭建 * 环境搭建方式 * 使用云服务器 * 使用终端软件连接到Linux * Linux常用命令 * ls * pwd * cd * touch * cat * mkdir * rm * cp * mv * tail * vim * grep * ps * netstat * 搭建java部署环境 * apt * JDK * MYSQL * 部署web项目到Linux * 什么是部署 * 环境配置 * 构建项目并打包 * 上传jar包运行程序 * 杀死进程 Linux环境搭建环境搭建方式主要有四种： 1. 直接安装在物理机上。但是 Linux 桌面使用起来非常不友好。所以不建议。【不推荐】。 2. 使用虚拟机软件，

Linux 动静态库完全指南：制作、使用、原理与实战

🔥草莓熊Lotso：个人主页 ❄️个人专栏: 《C++知识分享》《Linux 入门到实践：零基础也能懂》 ✨生活是默默的坚持，毅力是永久的享受！ 🎬 博主简介：文章目录 * 前言： * 一. 库的基础认知：是什么？有哪些？ * 1.1 库的本质 * 1.2 库的分类与系统位置 * 1.3 预备工作：自定义库源码 * 二. 静态库：编译时链接，独立运行 * 2.1 整体图示：理清思路 * 2.2 静态库制作流程（Makefile 自动化，更简便） * 2.3 静态库使用场景与命令 * 2.4 静态库核心特点 * 三. 动态库：运行时链接，