【PYTHON】视频转图片

【PYTHON】视频转图片

一、前期准备:安装依赖库

核心使用 opencv-python(OpenCV)库处理视频和图像,这是Python视觉处理的主流库,先通过pip安装:

# 安装opencv-python pip install opencv-python # 若需处理特殊视频格式(如MP4编码问题),可额外安装ffmpeg(可选)# Windows:下载ffmpeg并配置环境变量;Ubuntu:sudo apt install ffmpeg;Mac:brew install ffmpeg

二、方案1:基础版 - 按帧提取(提取所有帧/每隔N帧提取)

适合大多数标注场景,可灵活设置提取间隔,避免图片过多冗余。

完整代码

import cv2 import os defvideo_to_images_basic( video_path,# 输入视频文件路径(如:test.mp4) output_dir,# 输出图片文件夹路径 frame_interval=30,# 提取间隔:每30帧提取1张(默认30帧,对应1秒/帧,可调整) img_format="jpg",# 输出图片格式(jpg/png,推荐jpg,占用空间小) img_prefix="frame"# 图片文件名前缀(如:frame_0001.jpg)):# 1. 创建输出文件夹(若不存在则自动创建)ifnot os.path.exists(output_dir): os.makedirs(output_dir)print(f"创建输出文件夹:{output_dir}")# 2. 打开视频文件 cap = cv2.VideoCapture(video_path)ifnot cap.isOpened():raise ValueError(f"无法打开视频文件:{video_path}")# 3. 获取视频基本信息 total_frames =int(cap.get(cv2.CAP_PROP_FRAME_COUNT))# 视频总帧数 fps = cap.get(cv2.CAP_PROP_FPS)# 视频帧率(每秒帧数)print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},预计提取图片数={total_frames//frame_interval +1}")# 4. 循环提取帧并保存 frame_count =0# 当前帧计数器 saved_count =0# 已保存图片计数器whileTrue:# 读取一帧视频 ret, frame = cap.read()# 若读取失败(已到视频末尾),退出循环ifnot ret:break# 按间隔提取帧if frame_count % frame_interval ==0:# 构造图片文件名(补零对齐,方便排序) img_name =f"{img_prefix}_{saved_count:04d}.{img_format}" img_path = os.path.join(output_dir, img_name)# 保存图片 cv2.imwrite(img_path, frame)print(f"已保存:{img_path}") saved_count +=1 frame_count +=1# 5. 释放资源 cap.release()print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")# ------------------- 调用示例 -------------------if __name__ =="__main__":# 配置参数 VIDEO_PATH ="input_video.mp4"# 你的视频文件路径 OUTPUT_DIR ="extracted_images"# 图片输出文件夹 FRAME_INTERVAL =30# 每30帧提取1张(1秒1张,若视频帧率25,则每1.2秒1张)# 执行转换 video_to_images_basic( video_path=VIDEO_PATH, output_dir=OUTPUT_DIR, frame_interval=FRAME_INTERVAL, img_format="jpg")

三、方案2:进阶版 - 按时间间隔提取(更精准可控)

适合需要按固定时间间隔(如每2秒提取1张)的场景,比按帧间隔更直观,不受视频帧率影响。

完整代码

import cv2 import os defvideo_to_images_by_time( video_path,# 输入视频文件路径 output_dir,# 输出图片文件夹路径 time_interval=1.0,# 时间间隔:每1.0秒提取1张(可调整,如2.0=每2秒1张) img_format="jpg",# 输出图片格式 img_prefix="frame"# 图片文件名前缀):# 1. 创建输出文件夹ifnot os.path.exists(output_dir): os.makedirs(output_dir)print(f"创建输出文件夹:{output_dir}")# 2. 打开视频文件 cap = cv2.VideoCapture(video_path)ifnot cap.isOpened():raise ValueError(f"无法打开视频文件:{video_path}")# 3. 获取视频基本信息 total_frames =int(cap.get(cv2.CAP_PROP_FRAME_COUNT)) fps = cap.get(cv2.CAP_PROP_FPS) video_duration = total_frames / fps # 视频总时长(秒) frame_interval =int(fps * time_interval)# 换算为帧间隔print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},总时长={video_duration:.2f}秒")print(f"时间间隔={time_interval}秒,对应帧间隔={frame_interval}帧,预计提取图片数={int(video_duration//time_interval)+1}")# 4. 循环提取帧并保存 frame_count =0 saved_count =0 last_saved_time =0.0# 上一次保存图片的时间whileTrue: ret, frame = cap.read()ifnot ret:break# 获取当前帧对应的时间(秒) current_time = frame_count / fps # 按时间间隔保存if current_time - last_saved_time >= time_interval: img_name =f"{img_prefix}_{saved_count:04d}.{img_format}" img_path = os.path.join(output_dir, img_name) cv2.imwrite(img_path, frame)print(f"时间{current_time:.2f}秒:已保存 {img_path}") saved_count +=1 last_saved_time = current_time frame_count +=1# 5. 释放资源 cap.release()print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")# ------------------- 调用示例 -------------------if __name__ =="__main__": VIDEO_PATH ="input_video.mp4" OUTPUT_DIR ="extracted_images_by_time" TIME_INTERVAL =2.0# 每2秒提取1张图片 video_to_images_by_time( video_path=VIDEO_PATH, output_dir=OUTPUT_DIR, time_interval=TIME_INTERVAL, img_format="jpg")

四、核心功能说明

1. 关键函数与参数

  • cv2.VideoCapture(video_path):打开视频文件,返回视频捕获对象;
  • cap.read():读取一帧视频,返回(ret, frame)ret为布尔值(是否读取成功),frame为当前帧图像(numpy数组);
  • cap.get(cv2.CAP_PROP_FRAME_COUNT):获取视频总帧数;
  • cap.get(cv2.CAP_PROP_FPS):获取视频帧率(每秒播放的帧数);
  • cv2.imwrite(img_path, frame):将帧图像保存为图片文件;
  • 核心参数调整:
    • frame_interval(方案1):帧间隔,数值越大提取图片越少,推荐30(对应1秒1张);
    • time_interval(方案2):时间间隔,按需设置(如0.5=每0.5秒1张,5.0=每5秒1张)。

2. 实用优化点

  • 文件夹自动创建:无需手动创建输出文件夹,代码会自动判断并创建;
  • 文件名补零对齐:图片名格式为frame_0001.jpg,方便后续标注软件按顺序加载;
  • 格式灵活选择:支持jpg(占用空间小)和png(无损压缩,适合高精度标注);
  • 进度打印:实时打印保存路径,方便查看转换进度;
  • 资源释放:使用cap.release()释放视频资源,避免内存泄漏。

五、使用注意事项

  1. 视频路径问题
    • 若使用相对路径,需将视频文件放在Python脚本同一目录下;
    • 绝对路径示例(Windows):"D:/videos/test.mp4",(Linux/Mac):"/home/user/videos/test.mp4"
  2. 图片冗余控制
    • 标注时无需提取所有帧,建议按1~3秒间隔提取,避免图片过多增加标注工作量;
    • 若视频画面变化缓慢(如监控视频),可增大间隔(如5~10秒);
  3. 编码问题处理
    • 若出现“无法打开视频”或“保存图片失败”,大概率是视频编码不兼容,可先用FFmpeg转换为MP4格式(ffmpeg -i input.avi -c:v libx264 output.mp4);
  4. 内存占用
    • 处理超长视频时,无需担心内存溢出,代码逐帧读取并保存,不会缓存全部帧。

六、标注工具推荐

转换后的图片可使用以下主流标注工具进行标注:

  1. LabelImg:轻量级图形化标注工具,支持VOC/YOLO格式,适合目标检测标注;
  2. LabelMe:支持多边形、关键点等复杂标注,适合语义分割、实例分割标注;
  3. CVAT:工业级标注平台,支持批量标注、多人协作,适合大规模数据集标注。

Read more

Python 列表内存存储本质:存储差异原因与优化建议

Python 列表内存存储本质:存储差异原因与优化建议

文章目录 * 1. 问题引入:列表存储的内存 "膨胀" * 2. 理论存储与实际存储的差异 * 2.1 64位整数的存储差异 * 2.2 短字符串的存储差异 * 3. 列表的内存存储本质 * 3.1 相同元素列表内存少的核心原因:对象复用 * 3.1.1 小整数的缓存复用机制 * 3.1.2 字符串的驻留(Intern)机制 * 3.2 不同元素列表内存高的原因:对象重复创建 * 3.2.1 不同整数的内存开销 * 3.2.2 不同字符串的内存开销 * 4. 内存占用对比分析 * 5. 优化建议:利用对象复用减少内存开销 * 6. 总结

uv虚拟环境管理:venv创建、激活与Python版本指定

uv虚拟环境管理:venv创建、激活与Python版本指定 【免费下载链接】uvAn extremely fast Python package installer and resolver, written in Rust. 项目地址: https://gitcode.com/GitHub_Trending/uv/uv 引言:虚拟环境管理的痛点与解决方案 在Python开发中,虚拟环境(Virtual Environment)是隔离项目依赖的关键工具。传统工具如venv和virtualenv存在创建速度慢、版本管理繁琐等问题。uv作为一款用Rust编写的极速Python包管理器,提供了更高效的虚拟环境管理方案。本文将详细介绍如何使用uv创建、激活虚拟环境,并灵活指定Python版本,帮助开发者解决环境一致性和版本控制的痛点。 读完本文后,你将能够: * 使用uv快速创建虚拟环境 * 在不同操作系统下激活虚拟环境 * 灵活指定和管理Python版本 * 解决多项目环境冲突问题 * 利用uv的高级特性提升开发效率 uv虚拟环境基础 什么是虚拟环境 虚拟环境(

Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手

Python + AI:打造你的智能害虫识别助手 在农业生产中,病虫害是影响作物产量和品质的“隐形杀手”。传统的害虫识别依赖人工巡查,不仅耗时耗力,还容易因经验不足导致误判、漏判。而随着智慧农业的普及,AI技术正成为破解这一难题的关键——今天,我们就用Python从零搭建一个智能害虫识别助手,让电脑替你“火眼金睛”辨害虫,轻松搞定农作物病虫害预警! 一、为什么要做这个项目? 智慧农业的核心是“精准、高效、低成本”,而害虫识别正是其中的典型场景: * 对农户:无需专业植保知识,拍照就能识别害虫种类,快速匹配防治方案; * 对开发者:这是一个“小而美”的实战项目,覆盖AI开发全流程,从数据处理到模型部署,学完就能落地; * 技术价值:融合Python、深度学习、Web部署,是入门AI+垂直领域应用的绝佳案例。 这个项目不需要你有深厚的AI功底,只要掌握Python基础,跟着步骤走,就能做出一个能实际使用的智能识别工具。 二、项目核心技术栈 先明确我们要用到的工具,都是行业主流、

Python数据统计完全指南:从入门到实战

Python数据统计完全指南:从入门到实战

文章目录 * 1. 数据统计基础与环境配置 * 1.1 Python数据科学生态系统 * 1.2 环境配置与安装 * 2. 数据获取与加载 * 2.1 从不同数据源加载数据 * 2.2 数据基本信息查看 * 3. 数据清洗与预处理 * 3.1 缺失值处理 * 3.2 数据转换与编码 * 4. 描述性统计分析 * 4.1 基本统计量计算 * 4.2 高级统计分析 1. 数据统计基础与环境配置 1.1 Python数据科学生态系统 Python在数据统计领域的强大主要得益于其丰富的库生态系统: # 核心数据分析库import pandas as pd import numpy as np # 数据可视化库import matplotlib.pyplot

阿里云全品类 8 折券限时领,建站 / AI / 存储通用 立即领取