AI 辅助 Python 编程实战：5 个提升效率的真实案例 | 极客日志

PythonAI算法

AI 辅助 Python 编程实战：5 个提升效率的真实案例

通过五个真实案例展示了如何利用 AI 工具（如 GitHub Copilot、ChatGPT）提升 Python 编程效率。涵盖动态网页爬虫抓取、数据分析报告生成、批量合同自动化处理、机器学习模型构建以及 Flask 后端 API 搭建。内容包含详细代码示例与对比分析，旨在帮助开发者从手动编码转向 AI 辅助工作流，实现效率倍增。

奶糖兔发布于 2026/3/23更新于 2026/7/256.6K 浏览

AI 辅助 Python 编程实战：5 个提升效率的真实案例

引言

在 AI 编程时代，程序员不再是单纯的代码搬运工，而是指挥 AI 完成工作的工程师。Python 作为 AI 时代最友好的语言之一，正成为这场革命的主战场。本文将拆解 5 个真实案例，展示如何利用 AI 工具大幅提升开发效率。

案例一：爬虫救星——3 分钟搞定动态网页抓取

场景还原

数据分析师需要从使用 JavaScript 动态加载的电商网站抓取商品信息。传统 requests 直接抓取返回空白 HTML，手动翻页耗时且易被封 IP。

AI 生成方案

使用 Selenium 配合 AI 生成的代码，自动处理反爬机制、等待加载及翻页逻辑。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.options import Options
import time
import csv

def scrape_products(url):
    # 设置无头模式，避免被发现是自动化程序
    chrome_options = Options()
    chrome_options.add_argument("--headless")
    chrome_options.add_argument("--disable-blink-features=AutomationControlled")
    chrome_options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36")
    driver = webdriver.Chrome(options=chrome_options)
    driver.get(url)
    
    # 移除 webdriver 痕迹
    driver.execute_script("Object.defineProperty(navigator, 'webdriver', {get: () => false});")
    products = []
    try:
        while True:
            # 等待商品列表加载
            WebDriverWait(driver, 10).until(
                EC.presence_of_element_located((By.CLASS_NAME, "product-item"))
            )
            
            items = driver.find_elements(By.CLASS_NAME, )
             item  items:
                :
                    title = item.find_element(By.CLASS_NAME, ).text
                    price = item.find_element(By.CLASS_NAME, ).text
                    rating = item.find_element(By.CLASS_NAME, ).text
                    products.append({: title, : price, : rating})
                 Exception  e:
                    ()
                    
            
            :
                next_btn = WebDriverWait(driver, ).until(
                    EC.element_to_be_clickable((By.XPATH, ))
                )
                driver.execute_script(, next_btn)
                time.sleep()
            :
                ()
                
    :
        driver.quit()
     products

 __name__ == :
    url = 
    data = scrape_products(url)
    
     (, , newline=, encoding=)  f:
        writer = csv.DictWriter(f, fieldnames=[, , ])
        writer.writeheader()
        writer.writerows(data)
    ()

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
curl 转代码
解析常见 curl 参数并生成 fetch、axios、PHP curl 或 Python requests 示例代码。在线工具，curl 转代码在线工具，online

方法	耗时	代码行数	成功率
手写	4 小时	80+	60%
AI 生成	3 分钟	70	95%

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from scipy import stats
import numpy as np

# 读取数据
df = pd.read_csv('sales_data.csv')

# 基本信息
print("数据概览：")
print(df.head())
print(f"\n数据形状：{df.shape}")
print(f"缺失值:\n{df.isnull().sum()}")

# 转换日期
df['order_date'] = pd.to_datetime(df['order_date'])
df['month'] = df['order_date'].dt.to_period('M')

# 销售额最高的类别
top_category = df.groupby('category')['sales'].sum().sort_values(ascending=False).head(1)
print(f"\n销售额最高的类别：{top_category.index[0]}, 销售额：{top_category.values[0]:,.2f}")

# 按月销售额趋势
monthly_sales = df.groupby('month')['sales'].sum()
plt.figure(figsize=(10, 6))
monthly_sales.plot(kind='line', marker='o')
plt.title('Monthly Sales Trend')
plt.ylabel('Sales')
plt.xticks(rotation=45)
plt.grid(True)
plt.tight_layout()
plt.show()

# 异常值检测（Z-score）
z_scores = np.abs(stats.zscore(df['sales']))
outliers = df[z_scores > 3]
print(f"\n检测到 {len(outliers)} 个异常值（Z-score > 3）:")
print(outliers[['order_id', 'sales']])

# 相关性热力图
sns.heatmap(df.corr(numeric_only=True), annot=True, cmap='coolwarm')
plt.title('Feature Correlation Heatmap')
plt.show()

import pandas as pd
from docxtpl import DocxTemplate
from docx2pdf import convert
import os
from PyPDF2 import PdfWriter, PdfReader
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter
import smtplib
from email.mime.multipart import MIMEMultipart
from email.mime.base import MIMEBase
from email import encoders

def create_watermark(text="CONFIDENTIAL"):
    c = canvas.Canvas("watermark.pdf", pagesize=letter)
    c.setFont("Helvetica", 50)
    c.setFillColorRGB(0.5, 0.5, 0.5, alpha=0.3)
    c.rotate(45)
    c.drawCentredString(300, 100, text)
    c.save()

def add_watermark_and_encrypt(input_pdf, output_pdf, password):
    reader = PdfReader(input_pdf)
    writer = PdfWriter()
    watermark = PdfReader("watermark.pdf")
    for page in reader.pages:
        page.merge_page(watermark.pages[0])
        writer.add_page(page)
    writer.encrypt(password)
    with open(output_pdf, "wb") as f:
        writer.write(f)

def send_email(to_email, pdf_path, password):
    msg = MIMEMultipart()
    msg['From'] = '[email protected]'
    msg['To'] = to_email
    msg['Subject'] = "您的合同已生成"
    with open(pdf_path, "rb") as f:
        attach = MIMEBase('application', 'octet-stream')
        attach.set_payload(f.read())
        encoders.encode_base64(attach)
        attach.add_header('Content-Disposition', f'attachment; filename=contract.pdf')
        msg.attach(attach)
    server = smtplib.SMTP('smtp.gmail.com', 587)
    server.starttls()
    server.login(msg['From'], 'your_app_password')
    server.send_message(msg)
    server.quit()

# 主流程
df = pd.read_excel('clients.xlsx')
template = DocxTemplate('contract_template.docx')
create_watermark()
for _, row in df.iterrows():
    context = {
        'client_name': row['name'],
        'amount': f"¥{row['amount']:,.2f}",
        'date': row['date'].strftime('%Y年%m月%d日')
    }
    template.render(context)
    docx_path = f"output/{row['name']}_contract.docx"
    pdf_path = f"output/{row['name']}_contract.pdf"
    encrypted_pdf = f"output/{row['name']}_contract_encrypted.pdf"
    template.save(docx_path)
    convert(docx_path, pdf_path)
    add_watermark_and_encrypt(pdf_path, encrypted_pdf, row['password'])
    send_email(row['email'], encrypted_pdf, row['password'])
print("✅ 1000 份合同已生成并发送！")

任务	手动耗时	AI 辅助耗时
填写合同	20 小时	0 分钟
转 PDF	5 小时	2 分钟
加密	8 小时	1 分钟
发邮件	10 小时	3 分钟
总计	43 小时	6 分钟

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, roc_auc_score
import joblib
import matplotlib.pyplot as plt

# 读取数据
df = pd.read_csv('user_behavior.csv')

# 数据预处理
df['last_login'] = pd.to_datetime(df['last_login'])
df['days_since_login'] = (pd.Timestamp.now() - df['last_login']).dt.days
df = pd.get_dummies(df, columns=['plan_type', 'device'])

# 特征与标签
X = df.drop(['user_id', 'churn'], axis=1)
y = df['churn']

# 划分数据集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# 预测
y_pred = model.predict(X_test)
y_pred_proba = model.predict_proba(X_test)[:, 1]

# 评估
print(classification_report(y_test, y_pred))
print(f"AUC Score: {roc_auc_score(y_test, y_pred_proba):.3f}")

# 特征重要性
importances = model.feature_importances_
feature_names = X.columns
feat_importance = pd.Series(importances, index=feature_names).sort_values(ascending=False)
plt.figure(figsize=(10, 6))
feat_importance.head(10).plot(kind='bar')
plt.title('Top 10 Feature Importances')
plt.ylabel('Importance')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

# 保存模型
joblib.dump(model, 'churn_model.pkl')
print("✅ 模型已保存为 churn_model.pkl")

from flask import Flask, request, jsonify
from flask_sqlalchemy import SQLAlchemy
from flask_jwt_extended import JWTManager, create_access_token, jwt_required, get_jwt_identity
from werkzeug.security import generate_password_hash, check_password_hash
import os

app = Flask(__name__)
app.config['SQLALCHEMY_DATABASE_URI'] = 'sqlite:///users.db'
app.config['JWT_SECRET_KEY'] = 'your-super-secret-jwt-key-change-in-production'

db = SQLAlchemy(app)
jwt = JWTManager(app)

class User(db.Model):
    id = db.Column(db.Integer, primary_key=True)
    username = db.Column(db.String(80), unique=True, nullable=False)
    password_hash = db.Column(db.String(120), nullable=False)

    def set_password(self, password):
        self.password_hash = generate_password_hash(password)

    def check_password(self, password):
        return check_password_hash(self.password_hash, password)

@app.route('/register', methods=['POST'])
def register():
    data = request.get_json()
    username = data.get('username')
    password = data.get('password')
    if User.query.filter_by(username=username).first():
        return jsonify({"msg": "用户名已存在"}), 400
    user = User(username=username)
    user.set_password(password)
    db.session.add(user)
    db.session.commit()
    return jsonify({"msg": "注册成功"}), 201

@app.route('/login', methods=['POST'])
def login():
    data = request.get_json()
    username = data.get('username')
    password = data.get('password')
    user = User.query.filter_by(username=username).first()
    if user and user.check_password(password):
        token = create_access_token(identity=username)
        return jsonify(access_token=token), 200
    return jsonify({"msg": "用户名或密码错误"}), 401

@app.route('/profile', methods=['GET'])
@jwt_required()
def profile():
    current_user = get_jwt_identity()
    user = User.query.filter_by(username=current_user).first()
    return jsonify({"username": user.username, "id": user.id}), 200

if __name__ == '__main__':
    with app.app_context():
        db.create_all()
    app.run(debug=True)

工具	用途	链接
GitHub Copilot	IDE 内实时代码补全	https://github.com/features/copilot
ChatGPT	通用代码生成	https://chat.openai.com
Claude	长文本理解强	https://claude.ai
Cursor	AI 原生代码编辑器	https://cursor.sh
Jupyter AI	Notebook 内 AI 助手	https://jupyter-ai.readthedocs.io

AI 辅助 Python 编程实战：5 个提升效率的真实案例

AI 辅助 Python 编程实战：5 个提升效率的真实案例

引言

案例一：爬虫救星——3 分钟搞定动态网页抓取

场景还原

AI 生成方案

更多推荐文章

相关免费在线工具

效率对比

案例二：数据分析——1 行提示生成完整分析报告

场景

AI 生成方案

效率提升

案例三：自动化办公——1000 份合同自动生成

场景

AI 生成方案

效率对比

案例四：机器学习——不用懂算法也能跑模型

场景

AI 生成方案

案例五：Flask 后端——10 分钟搭建 API 服务

场景

AI 生成方案

总结

附录：AI 编程工具推荐

更多推荐文章

相关免费在线工具

AI 辅助 Python 编程实战：5 个提升效率的真实案例

AI 辅助 Python 编程实战：5 个提升效率的真实案例

引言

案例一：爬虫救星——3 分钟搞定动态网页抓取

场景还原

AI 生成方案

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

效率对比

案例二：数据分析——1 行提示生成完整分析报告

场景

AI 生成方案

效率提升

案例三：自动化办公——1000 份合同自动生成

场景

AI 生成方案

效率对比

案例四：机器学习——不用懂算法也能跑模型

场景

AI 生成方案

案例五：Flask 后端——10 分钟搭建 API 服务

场景

AI 生成方案

总结

附录：AI 编程工具推荐

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具