B 站弹幕分析工具：自动抓取、词云与情感分析 | 极客日志

PythonAI算法

B 站弹幕分析工具：自动抓取、词云与情感分析

本项目是一个基于 Python 的 B 站弹幕分析工具，支持自动抓取视频弹幕、清洗分词、生成词云及情感分析报告。核心功能包括解析 BVID 获取 CID、导出结构化数据、利用 jieba 和 SnowNLP 进行文本处理与情绪打分。适用于内容运营复盘、新媒体舆情监测及创作者粉丝反馈分析。通过停用词过滤和噪声词清洗保证词云质量，输出正负向占比及代表性样本，帮助团队快速形成可汇报的数据材料。

DotNetGuy发布于 2026/3/29更新于 2026/7/2546 浏览

本项目是一个基于 Python 的 B 站弹幕分析工具，支持自动抓取视频弹幕、清洗分词、生成词云及情感分析报告。

一、项目解决的问题

日常做视频复盘时，常见痛点是：

弹幕采集麻烦：每次手动导出/复制，效率很低。
词云质量不稳定：不清洗会被'哈哈哈/666/这边那边'污染。
舆情判断缺标准：没有统一口径，沟通时容易'拍脑袋'。

该项目把整条链路打通了：

抓取 → 清洗 → 关键词 → 词云 → 情感 → 报告

二、功能特性

自动解析 BVID -> CID，抓取弹幕 XML
导出结构化数据：CSV / JSON / TXT
jieba 分词 + 干扰词清洗
SnowNLP 情感分析（正/中/负分布）
wordcloud 生成高密度中文词云 PNG
自动生成 Markdown 舆情报告

三、项目结构

bilibili-danmaku/
├── SKILL.md
├── README.md
├── README.en.md
├── requirements.txt
├── scripts/
│   ├── ensure_env.sh
│   ├── fetch_danmaku.py
│   ├── fetch.sh
│   ├── analyze_danmaku.py
│   └── analyze.sh
├── references/
│   ├── methodology.md
│   └── stopwords.default.txt
└── output/

四、源码部署方式

1）安装依赖

cd bilibili-danmaku
bash scripts/ensure_env.sh

2）抓取弹幕

python3 scripts/fetch_danmaku.py \
--url "https://www.bilibili.com/video/BV17JfuBqEqg" \
--outdir "./output"

支持短链：

python3 scripts/fetch_danmaku.py --url "https://b23.tv/gO0nMGs" --outdir "./output"

3）分析并出报告

bash scripts/analyze.sh "./output/<xxx>_danmaku.csv" "./output/<xxx>_meta.json" "./output" "task_name"

输出文件：

task_name_top_words.json
task_name_sentiment.json
task_name_wordcloud.png
task_name_report.md

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

./.venv/bin/python scripts/analyze_danmaku.py \
--csv "./output/<xxx>_danmaku.csv" \
--meta "./output/<xxx>_meta.json" \
--outdir "./output" \
--name "task_clean" \
--extra-stopwords "妈妈，亲戚，那边，这边"

B 站弹幕分析工具：自动抓取、词云与情感分析

一、项目解决的问题

二、功能特性

三、项目结构

四、源码部署方式

1）安装依赖

2）抓取弹幕

3）分析并出报告

更多推荐文章

相关免费在线工具

五、词云清洗逻辑

六、情感分析实现

七、适用场景

八、使用建议

九、开源地址

十、免责声明

更多推荐文章

相关免费在线工具

B 站弹幕分析工具：自动抓取、词云与情感分析

一、项目解决的问题

二、功能特性

三、项目结构

四、源码部署方式

1）安装依赖

2）抓取弹幕

3）分析并出报告

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

五、词云清洗逻辑

六、情感分析实现

七、适用场景

八、使用建议

九、开源地址

十、免责声明

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具