引言
在干活儿的时候,总会遇到一些重复、机械的事情——给 PDF 加个页、扫一堆二维码、监控机器温度,或者临时起意要把文档转成语音。每次手动搞都很烦,不如让 Python 代劳。
下面这十个脚本是我在不同场景下攒出来的,有些是一次性救急的,有些已经成了日常工具箱的一部分。它们都跑在 Python 3.6 以上环境,依赖库你看着装就行,建议单独建个虚拟环境,免得弄脏系统。
pip install gazpacho qrtools pyautogui Pillow PyPDF2 gTTS howdoi opencv-python pythonnet instabot moviepy
1. 抓取网页内容
有时候只想快速从某个页面掏出标题和段落,不需要重型爬虫框架。gazpacho 简单直接,指定个 User-Agent 就能开工。
import gazpacho
url = 'https://www.example.com/'
headers = {'User-Agent': 'Mozilla/5.0'}
html = gazpacho.get(url, headers=headers)
print(f"Status: {html.status}")
parse = gazpacho.Soup(html)
h1 = parse.find('h1')
if h1:
print(f"Title: {h1.text}")
paragraphs = parse.find_all('p')
for p in paragraphs[:3]:
print(p.text.strip())
# 按类名抓
special = parse.find('.class-name')
if special:
print(special.text)
一般我会把请求间隔调大一点,别手贱去冲人家的服务器,被封 IP 就划不来了。
2. 批量读取二维码
物流或者给设备贴码的场景经常需要扫一大堆图片里的二维码。虽然 qrtools 有点老了,但胜在接口简单,要是报错可以直接换 pyzbar。
from qrtools import Qr
def scan_qr_image(image_path):
try:
qr = Qr()
qr.decode(image_path)
return qr.data if qr.data else "No data found"
Exception e:
(scan_qr_image())


