【PYTHON】视频转图片

【PYTHON】视频转图片

一、前期准备:安装依赖库

核心使用 opencv-python(OpenCV)库处理视频和图像,这是Python视觉处理的主流库,先通过pip安装:

# 安装opencv-python pip install opencv-python # 若需处理特殊视频格式(如MP4编码问题),可额外安装ffmpeg(可选)# Windows:下载ffmpeg并配置环境变量;Ubuntu:sudo apt install ffmpeg;Mac:brew install ffmpeg

二、方案1:基础版 - 按帧提取(提取所有帧/每隔N帧提取)

适合大多数标注场景,可灵活设置提取间隔,避免图片过多冗余。

完整代码

import cv2 import os defvideo_to_images_basic( video_path,# 输入视频文件路径(如:test.mp4) output_dir,# 输出图片文件夹路径 frame_interval=30,# 提取间隔:每30帧提取1张(默认30帧,对应1秒/帧,可调整) img_format="jpg",# 输出图片格式(jpg/png,推荐jpg,占用空间小) img_prefix="frame"# 图片文件名前缀(如:frame_0001.jpg)):# 1. 创建输出文件夹(若不存在则自动创建)ifnot os.path.exists(output_dir): os.makedirs(output_dir)print(f"创建输出文件夹:{output_dir}")# 2. 打开视频文件 cap = cv2.VideoCapture(video_path)ifnot cap.isOpened():raise ValueError(f"无法打开视频文件:{video_path}")# 3. 获取视频基本信息 total_frames =int(cap.get(cv2.CAP_PROP_FRAME_COUNT))# 视频总帧数 fps = cap.get(cv2.CAP_PROP_FPS)# 视频帧率(每秒帧数)print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},预计提取图片数={total_frames//frame_interval +1}")# 4. 循环提取帧并保存 frame_count =0# 当前帧计数器 saved_count =0# 已保存图片计数器whileTrue:# 读取一帧视频 ret, frame = cap.read()# 若读取失败(已到视频末尾),退出循环ifnot ret:break# 按间隔提取帧if frame_count % frame_interval ==0:# 构造图片文件名(补零对齐,方便排序) img_name =f"{img_prefix}_{saved_count:04d}.{img_format}" img_path = os.path.join(output_dir, img_name)# 保存图片 cv2.imwrite(img_path, frame)print(f"已保存:{img_path}") saved_count +=1 frame_count +=1# 5. 释放资源 cap.release()print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")# ------------------- 调用示例 -------------------if __name__ =="__main__":# 配置参数 VIDEO_PATH ="input_video.mp4"# 你的视频文件路径 OUTPUT_DIR ="extracted_images"# 图片输出文件夹 FRAME_INTERVAL =30# 每30帧提取1张(1秒1张,若视频帧率25,则每1.2秒1张)# 执行转换 video_to_images_basic( video_path=VIDEO_PATH, output_dir=OUTPUT_DIR, frame_interval=FRAME_INTERVAL, img_format="jpg")

三、方案2:进阶版 - 按时间间隔提取(更精准可控)

适合需要按固定时间间隔(如每2秒提取1张)的场景,比按帧间隔更直观,不受视频帧率影响。

完整代码

import cv2 import os defvideo_to_images_by_time( video_path,# 输入视频文件路径 output_dir,# 输出图片文件夹路径 time_interval=1.0,# 时间间隔:每1.0秒提取1张(可调整,如2.0=每2秒1张) img_format="jpg",# 输出图片格式 img_prefix="frame"# 图片文件名前缀):# 1. 创建输出文件夹ifnot os.path.exists(output_dir): os.makedirs(output_dir)print(f"创建输出文件夹:{output_dir}")# 2. 打开视频文件 cap = cv2.VideoCapture(video_path)ifnot cap.isOpened():raise ValueError(f"无法打开视频文件:{video_path}")# 3. 获取视频基本信息 total_frames =int(cap.get(cv2.CAP_PROP_FRAME_COUNT)) fps = cap.get(cv2.CAP_PROP_FPS) video_duration = total_frames / fps # 视频总时长(秒) frame_interval =int(fps * time_interval)# 换算为帧间隔print(f"视频信息:总帧数={total_frames},帧率={fps:.2f},总时长={video_duration:.2f}秒")print(f"时间间隔={time_interval}秒,对应帧间隔={frame_interval}帧,预计提取图片数={int(video_duration//time_interval)+1}")# 4. 循环提取帧并保存 frame_count =0 saved_count =0 last_saved_time =0.0# 上一次保存图片的时间whileTrue: ret, frame = cap.read()ifnot ret:break# 获取当前帧对应的时间(秒) current_time = frame_count / fps # 按时间间隔保存if current_time - last_saved_time >= time_interval: img_name =f"{img_prefix}_{saved_count:04d}.{img_format}" img_path = os.path.join(output_dir, img_name) cv2.imwrite(img_path, frame)print(f"时间{current_time:.2f}秒:已保存 {img_path}") saved_count +=1 last_saved_time = current_time frame_count +=1# 5. 释放资源 cap.release()print(f"\n转换完成!共保存 {saved_count} 张图片,存储路径:{output_dir}")# ------------------- 调用示例 -------------------if __name__ =="__main__": VIDEO_PATH ="input_video.mp4" OUTPUT_DIR ="extracted_images_by_time" TIME_INTERVAL =2.0# 每2秒提取1张图片 video_to_images_by_time( video_path=VIDEO_PATH, output_dir=OUTPUT_DIR, time_interval=TIME_INTERVAL, img_format="jpg")

四、核心功能说明

1. 关键函数与参数

  • cv2.VideoCapture(video_path):打开视频文件,返回视频捕获对象;
  • cap.read():读取一帧视频,返回(ret, frame)ret为布尔值(是否读取成功),frame为当前帧图像(numpy数组);
  • cap.get(cv2.CAP_PROP_FRAME_COUNT):获取视频总帧数;
  • cap.get(cv2.CAP_PROP_FPS):获取视频帧率(每秒播放的帧数);
  • cv2.imwrite(img_path, frame):将帧图像保存为图片文件;
  • 核心参数调整:
    • frame_interval(方案1):帧间隔,数值越大提取图片越少,推荐30(对应1秒1张);
    • time_interval(方案2):时间间隔,按需设置(如0.5=每0.5秒1张,5.0=每5秒1张)。

2. 实用优化点

  • 文件夹自动创建:无需手动创建输出文件夹,代码会自动判断并创建;
  • 文件名补零对齐:图片名格式为frame_0001.jpg,方便后续标注软件按顺序加载;
  • 格式灵活选择:支持jpg(占用空间小)和png(无损压缩,适合高精度标注);
  • 进度打印:实时打印保存路径,方便查看转换进度;
  • 资源释放:使用cap.release()释放视频资源,避免内存泄漏。

五、使用注意事项

  1. 视频路径问题
    • 若使用相对路径,需将视频文件放在Python脚本同一目录下;
    • 绝对路径示例(Windows):"D:/videos/test.mp4",(Linux/Mac):"/home/user/videos/test.mp4"
  2. 图片冗余控制
    • 标注时无需提取所有帧,建议按1~3秒间隔提取,避免图片过多增加标注工作量;
    • 若视频画面变化缓慢(如监控视频),可增大间隔(如5~10秒);
  3. 编码问题处理
    • 若出现“无法打开视频”或“保存图片失败”,大概率是视频编码不兼容,可先用FFmpeg转换为MP4格式(ffmpeg -i input.avi -c:v libx264 output.mp4);
  4. 内存占用
    • 处理超长视频时,无需担心内存溢出,代码逐帧读取并保存,不会缓存全部帧。

六、标注工具推荐

转换后的图片可使用以下主流标注工具进行标注:

  1. LabelImg:轻量级图形化标注工具,支持VOC/YOLO格式,适合目标检测标注;
  2. LabelMe:支持多边形、关键点等复杂标注,适合语义分割、实例分割标注;
  3. CVAT:工业级标注平台,支持批量标注、多人协作,适合大规模数据集标注。

Read more

claude code的安装和更新方法(macos)

claude code的安装和更新方法(macos)

目录 一、native安装:Run `claude install` 二、npm安装 1. 安装 node.js 2. 安装/更新 claude code 2.1. 检查当前版本和最新版本 3. Claude Code 自带更新命令: claude update 一句话总结:用npm安装claude code,用brew安装npm,用node来安装npm * homebrew是macos的系统级包管理器,类似app store的命令行版 * npm是node.js的包管理器,类似python的pip 【注意】 1)brew也可以安装claude code,而且能一条命令搞定安装和更新 (安装:brew install claude-code;更新:brew upgrade 一次性更新所有软件)

Flutter 三方库 bs58 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、高效的 Base58 数字货币与区块链数据编解码引擎

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net Flutter 三方库 bs58 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、高效的 Base58 数字货币与区块链数据编解码引擎 在鸿蒙(OpenHarmony)系统的分布式账本、Web3 钱包或加密金融应用中,如何处理类似比特币(Bitcoin)地址这种具备“高易读性”且“无歧义”的编码?bs58 为开发者提供了一套工业级的 Base58 编解码实现方案。本文将带您实战其在鸿蒙生态中的加密应用。 前言 什么是 Base58?它是一种针对数字资产设计的字节编码方案。相比传统的 Base64,它特意去除了容易引起混淆的字符(如 0, O, I, l 等),并去除了在双击选择时可能产生问题的非字母符号。在 Flutter for OpenHarmony 的实际开发中,

已解决:Cannot find a valid baseurl for repo: base/7/x86_64

已解决:Cannot find a valid baseurl for repo: base/7/x86_64

使用 Yum 命令遇到此错误,下图是报错信息: 分析:由第二行报错信息得在尝试从 CentOS 镜像列表获取信息时遇到了问题,无法解析 mirrorlist.centos.org 这个域名。这可能是由于网络连接问题导致的。 以下是解决方法: 一、首先通过 ping 命令检查网络连接,确保网络能够正常访问外网。 ping www.baidu.com  Ctrl + c 停止访问 可以正常访问的结果如下图所示: 二、如果网络正常,问题可能是当前的镜像源出现故障或者当前网络无法访问镜像源。可以尝试更换为其他可用的镜像源。 可以通过 vi 命令编辑 /etc/yum.repos.d/CentOS-Base.repo 文件,将其中的 mirrorlist 行用 # 号注释掉,并将 baseurl 行取消注释,并修改为其他可靠的镜像地址。

Linux:初始网络(下)

或许你有一个疑问,“发请求、收响应”,却不清楚数据在网线里到底是怎么从一台主机走到另一台主机的。这篇博客在上一篇博客基础上,将最基础的局域网通信原理出发,拆解数据封装与解包的核心逻辑,再延伸到跨网段的网络传输,帮你建立起网络传输的完整宏观认知,所以大家要认真阅读啦~~ 一、同局域网通信:以太网内的主机如何直接对话 局域网是我们最常接触的网络场景,比如家里的路由器连接的电脑、手机,公司内网的办公设备,都属于同一个局域网。我们先从最核心的问题切入,理解局域网通信的底层逻辑 1. 核心问题:同一局域网的两台主机,能直接通信吗? 答案是:完全可以!局域网内的主机通信,本质是基于以太网协议、通过 MAC 地址完成的二层直连通信,原理就像我们在同一个教室里上课:老师喊出同学的名字,全班同学都能听到这个声音,但只有名字对应的同学会做出回应,其他同学会自动忽略这个信息 2. 局域网通信的唯一身份标识:MAC 地址 在以太网的局域网里,每一台主机的唯一性,靠的就是 MAC 地址来保证。 * 核心定义:MAC 地址用来识别数据链路层中相连的节点,是网卡的 “物理身份证”