在线浏览“秀人网合集”的新思路：30 行 Python 把封面图链接秒变本地可点图库

Ne0inhk

16 Mar 2026 — 3 min read

用 30 行 Python 把秀人网公开合集“搬”进本地数据库

“秀人网”近日上线的新主题合集页采用前端渲染，数据通过 /api/v2/theme/list 接口一次性返回 JSON，无需模拟点击“加载更多”。接口无登录限制，但带 5 秒滑动窗口的 IP 频次校验：单 IP >30 次/分即返回 429。本文示范如何遵守 robots 协议、放缓速率，仅采集“公开可见”字段，并给出断点续抓、User-Agent 随机化、异常重试等常用技巧。
核心思路三步走：
分析列表接口：在浏览器 DevTools 里筛选 XHR，发现真实请求 URL 形如
https://www.xiuren.net/api/v2/theme/list?page={page}&size=20，返回体含 data.total 与 data.list。
解析单条记录：字段 title、author、coverUrl 即为我们需要的元数据，无需再进详情页。
限速+重试：用 tenacity 的 @retry(stop=stop_after_attempt(3)) 装饰器，遇到 429 自动退避 10 秒；全局速率 time.sleep(random.uniform(1, 2))，确保平均 <30 次/分。
运行环境：Python≥3.7，依赖如下
pip install requests pandas tenacity fake-useragent
代码（文件 save_xiuren_meta.py）：

#!/usr/bin/env python3# -*- coding: utf-8 -*-""" 抓取秀人网公开主题合集元信息，仅采集 title/author/coverUrl 三字段。 仅供学习，请遵守平台 robots.txt 与相关法律法规。 """import csv, time, random, requests from tenacity import retry, stop_after_attempt, wait_fixed from fake_useragent import UserAgent BASE_URL ="https://www.xiuren.net/api/v2/theme/list" CSV_FILE ="xiuren_meta.csv" PAGE_SIZE =20 MAX_PAGE =50# 按需调整，0 表示抓全量 SLEEP_RANGE =(1,2)# 秒，随机休眠 ua = UserAgent() session = requests.Session() session.headers.update({"Referer":"https://www.xiuren.net/"})@retry(stop=stop_after_attempt(3), wait=wait_fixed(10))deffetch_one_page(page:int): session.headers.update({"User-Agent": ua.random}) params ={"page": page,"size": PAGE_SIZE} resp = session.get(BASE_URL, params=params, timeout=10)if resp.status_code ==429:raise Exception("Rate limited") resp.raise_for_status()return resp.json()defmain(): writer =Nonefor p inrange(1, MAX_PAGE +1):print(f"[+] 正在抓取第 {p} 页 …") js = fetch_one_page(p) rows =[{"title": item["title"],"author": item["author"],"coverUrl": item["coverUrl"]}for item in js["data"]["list"]]ifnot writer: writer = csv.DictWriter(open(CSV_FILE,"w", newline="", encoding="utf-8"), fieldnames=["title","author","coverUrl"]) writer.writeheader() writer.writerows(rows)if js["data"]["total"]<= p * PAGE_SIZE:break time.sleep(random.uniform(*SLEEP_RANGE))print(f"[√] 抓取完成，已写入 {CSV_FILE}")if __name__ =="__main__": main()

运行后同级目录生成 xiuren_meta.csv，可导入 Excel 或数据库二次分析。若需增量更新，可把 CSV_FILE 改为 SQLite，并在写入前按 title 做唯一索引去重。
再次提醒：
仅抓取“公开可见”字段，不绕过登录、不破解加密参数；
速率温和，不干扰站点正常服务；
数据勿商用，尊重原作者版权。
祝各位读者调试顺利，也欢迎把改进方案提交到开源社区，共同维护良好的技术交流氛围。

单双序列问题——动态规划

文章目录 * 一、最长递增子序列 * 二、等差数列划分II-子序列 * 三、最长公共子序列 * 四、正则表达式匹配动态规划是解决复杂算法问题的利器，本文将聚焦于单序列与双序列两类经典问题，通过分析最长递增子序列、正则表达式匹配等典型案例，深入剖析动态规划的状态定义与转移方程构建思路。在阅读该文章时最好对基础的动态规划有所了解，因为在此不会讲解动态规划基础的细节，大家可以通过阅读下文进行学习：基础dp——动态规划多状态dp——动态规划子数组问题——动态规划单序列问题往往具备两个关键特征，使其特别适合用动态规划求解。 * 问题解决路径需拆解为多个步骤，每个步骤都存在多种选择，最终目标是计算可行解的总数，或是找到满足条件的最优解。 * 问题的输入数据通常呈现为序列形态，比如一维数组、字符串等典型的线性数据结构。根据题目的特点找出该元素对应的最优解（或解的数目）和前面若干元素（通常是一个或两个）的最优解（或解的数目）的关系，并以此找出相应的状态转移方程。一旦找出了状态转移方程，只要注意避免不必要的重复计算，问题就能迎刃而解。下面讲解两个适合运用动态规划的单序

《图论算法入门：掌握DFS和BFS，理解图与树的遍历》

🎬 博主名称：个人主页 🔥 个人专栏: 《算法通关》，《Java讲解》 ⛺️心简单，世界就简单目录序言 DFS 全排列问题剪枝操作---n皇后问题 BFS 树与图的深度优先遍历树，图的存储遍历树，图树与图的宽度优先遍历序言到图论这章节了，先讲讲DFS，BFS，然后讲树和图咋存储，还有树和图的DFS以及BFS， DFS dfs是一个执着的人（可爱捏），他一直搜索到叶子节点，然后才会回头去看别的路，然后继续一条路走到头从数据结构来看，我们的dfs用的是栈从空间来看，我们dfs空间使用是与高度成正比的O( h ) 我们dfs搜索是一条路走到头，所以我们dfs不具有最短路的性质我们来看个最经典的题，全排列问题我们从0开始出发，然后往下搜，当搜到n的话就说明我们搜完了输出一下就行（用path记录搜索的路径），当搜完之后，我们肯定要恢复原状，所以把st给回复，path不用是因为，下次直接就覆盖了，不用再path[

哈希的介绍

1. unordered系列关联式容器下面来看哈希，首先看关联式容器unorder_map和unorder_set，它们底层是哈希表，用法和map set一样。下面浅浅过一下，它是单向迭代器，因为没有rbegin和rend。也就是红黑树和哈希表实现的map和set用法几乎相同，区别是：1.unorder系列是单向迭代器。2.unorder系列遍历出来不是有序的。下面演示一下：它只能去重，不能排序，它也是有multi版本的。再演示一下unorder_map： 2.哈希下面正式看哈希，什么是哈希呢？我们以前遇到的搜索有这样几类：首先是暴力查找，在一个数组里都查，这样非常慢。于是有人衍生出了有序数组的二分查找，但它的前提是排序，而且增删查改不方便，过程中为了保证有序会涉及大量的数据挪动。因此衍生出了平衡搜索树，此时基础上又出现了新的搜索，这种搜索叫哈希(散列)。它的本质是存储的值跟存储位置建立出一个映射关系，什么意思呢，先来看一个计数排序的样例：有上面这样的一组值，最小的值是15，最大的值是30，总共开了16个空间。然后存映射关系(次数)，15映射第一个位

(LeetCode 面试经典 150 题) 61. 旋转链表（链表）

题目：61. 旋转链表思路：链表，时间复杂度0(n)。 C++版本： /** * Definition for singly-linked list. * struct ListNode { * int val; * ListNode *next; * ListNode() : val(0), next(nullptr) {} * ListNode(int x) : val(x), next(nullptr) {} * ListNode(int x, ListNode *next) : val(x), next(next) {} * }; */classSolution{public: ListNode*rotateRight(ListNode* head,int k){if(head=

Read more

单双序列问题——动态规划

《图论算法入门：掌握DFS和BFS，理解图与树的遍历》

哈希的介绍

(LeetCode 面试经典 150 题) 61. 旋转链表 （链表）

(LeetCode 面试经典 150 题) 61. 旋转链表（链表）