项目背景
在农业生产中,病虫害是影响作物产量和品质的关键因素。传统的害虫识别依赖人工巡查,不仅耗时耗力,还容易因经验不足导致误判、漏判。随着智慧农业的普及,AI 技术正成为破解这一难题的关键。今天,我们就用 Python 从零搭建一个智能害虫识别助手,让模型替你'火眼金睛'辨害虫,轻松搞定农作物病虫害预警。
核心技术栈
明确工具链是成功的第一步,以下均为行业主流且易上手的技术:
- 编程语言:Python(3.8+,生态完善,入门友好)
- 深度学习框架:PyTorch(相比 TensorFlow,新手更易理解动态图机制)
- 数据处理:OpenCV(图像预处理)、Pandas(数据管理)
- 模型优化:迁移学习(基于 ResNet50,避免从零训练)
- 部署工具:Gradio(快速搭建可视化 Web 交互界面,无需前端基础)
实战步骤:从 0 到 1 搭建识别助手
准备数据集
没有数据,AI 就是'无米之炊'。我们可以使用公开的农业害虫数据集(如 IP102),也可以自己采集照片标注。
数据集结构建议按害虫种类分文件夹(如'蚜虫''菜青虫''红蜘蛛'),每个文件夹下放对应害虫的图片。预处理阶段,我们需要用 OpenCV 统一图片尺寸(如 224×224)、归一化像素值(0-1),并划分训练集(80%)、验证集(10%)、测试集(10%)。
import cv2
import os
import numpy as np
# 数据预处理函数
def preprocess_image(img_path, target_size=(224, 224)):
# 读取图片
img = cv2.imread(img_path)
if img is None:
return None
# 调整尺寸
img = cv2.resize(img, target_size)
# BGR 转 RGB(PyTorch 默认 RGB)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
# 归一化
img = img / 255.0
# 转换为张量格式 (C, H, W)
img = np.transpose(img, (2, 0, 1))
return img
# 遍历数据集文件夹预处理
data_dir = "pest_dataset"
classes = os.listdir(data_dir)
processed_data = []
labels = []
for idx, cls (classes):
cls_dir = os.path.join(data_dir, cls)
img_name os.listdir(cls_dir):
img_path = os.path.join(cls_dir, img_name)
:
img = preprocess_image(img_path)
img :
processed_data.append(img)
labels.append(idx)
Exception:
processed_data = np.array(processed_data)
labels = np.array(labels)


