OpenDroneMap (ODM) 无人机影像三维模型重建安装及使用快速上手

OpenDroneMap (ODM) 无人机影像三维模型重建安装及使用快速上手

1 文档概述

本文档是指导用户从零开始,使用 OpenDroneMap 对无人机采集的影像数据进行处理,生成三维点云、数字表面模型(DSM)、正射影像图(Orthomosaic)等成果。

本文档的预期读者为拥有无人机航拍影像(JPG/PNG格式)并希望进行三维建模的用户。

2.1 系统运行环境要求

- 操作系统:Windows 10/11, macOS, 或 Linux (推荐 Ubuntu)。

- CPU:多核心处理器(4核以上推荐,8核或更多更佳)(处理200张以上影像建议16GB+)。

- 内存 (RAM):至少 16GB,处理大面积区域建议 32GB 或以上。

- 硬盘空间:预留充足的存储空间。原始影像、中间文件和最终成果会占用大量空间。建议准备 影像大小的10-20倍 的可用空间(例如,1GB影像需要10-20GB空间)。

- 显卡 (GPU):虽然ODM主要依赖CPU,但拥有支持CUDA的NVIDIA GPU可以显著加速某些步骤(如深度图计算)。AMD/Intel集成显卡也可运行,但速度较慢

2.2 数据准备

· 将无人机采集的所有照片集中存放在一个文件夹中。

· 确保照片包含GPS信息(EXIF中的GPS Latitude, GPS Longitude, GPS Altitude)。这是自动定位的关键。检查方式:右键图片查看属性,图片需要带有位置信息,如下图所示:

· 建议使用一致的拍摄设置(分辨率、焦距、光圈),重叠率建议:航向重叠70%-80%,旁向重叠60%-70%。

· 清理掉模糊、过曝或完全遮挡的照片。· 如果没有数据,可以参考官方提供的数据示例:比如使用aukerman数据:

https://github.com/OpenDroneMap/ODMdata

3. OMD安装部署

3.1 系统安装说明

3.1.1 手动安装(推荐)

下载地址:https://github.com/OpenDroneMap/ODM/releases 

下载exe文件,双击安装运行,运行成功后出现ODM Console弹窗。

3.1.2 Docker安装指南

ODM推荐使用Docker容器化部署,避免复杂的依赖配置。以下是各操作系统的安装步骤(已安装Docker或者Dockerdesktop可以忽略安装部分,直接拉取镜像):

3.1.2.1 Windows系统

 1、访问Docker Desktop官网下载安装程序:

https://www.docker.com/products/docker-desktop/

2、双击安装文件,启用"使用WSL 2而不是Hyper-V"选项

3、安装完成后启动Docker,等待系统托盘图标显示"Docker Desktop running"

3.1.2.2 macOS系统

使用Homebrew安装:brew install --cask docker

从应用程序文件夹启动Docker

首次运行需在系统偏好设置→安全性与隐私中允许开发者权限。

3.1.2.3 Linux系统

# Ubuntu/Debian示例 sudo apt-get update sudo apt-get install docker-ce docker-ce-cli containerd.io sudo usermod -aG docker $USER  # 允许当前用户运行docker命令 newgrp docker  # 无需重启即可应用用户组变更

3.1.2.4 镜像包拉取

验证Docker是否安装成功:

docker --version  # 应显示Docker version 20.10+

拉取odm镜像

docker pull opendronemap/odm:latest

中国用户可使用镜像加速服务:

docker pull registry.docker-cn.com/opendronemap/odm

4. 系统使用说明

4.1 航拍照片处理

需要新建一个文件夹,并在里面建立一个images文件夹(存放要拼接的图片),图片需要自带GPS信息,(如果没有GPS信息,则需要用geo.txt文件存放图片的GPS信息)。

4.2 手动安装ODM执行(推荐)

在ODM Console弹窗中输入‘run --feature-type=sift --matcher-type=flann --skip-3dmodel D:\odm_test’ 运行,其中最后面‘D:\odm_tes’为存放照片的文件夹路径。

run --feature-type=sift --matcher-type=flann --skip-3dmodel D:\odm_test

等待执行,(24张照片,我大概跑了10分钟)出现ODM app finished以下页面,则表示运行完毕。

文件夹中,除了准备的images、geo.txt和test.py准备文件,剩下的都是生成的结果文件,按需选择相应的结果。使用meshlab软件查看ply文件,可以看到三维模型。

4.3 Docker版本ODM执行

4.3.1 基础重建命令详解

在终端中执行以下命令启动基础重建流程:

Linux/Mac示例

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project

Windows示例

docker run -ti --rm -v c:/datasets:/datasets opendronemap/odm --project-path /datasets/my_project

命令参数解析:

-ti:启用交互式终端

--rm:处理完成后自动删除容器

-v:挂载本地目录到容器内(格式:本地路径:容器路径)

--project-path:指定项目根目录

my_project:项目名称(对应datasets下的文件夹)

执行命令后,ODM将显示实时进度,典型输出如下:

[INFO]    Initializing ODM 3.1.9

[INFO]    Maximum photo dimensions: 5472px

[INFO]    Loading 120 images

[INFO]    Found GPS coordinates in EXIF data

[INFO]    Running OpenSfM reconstruction

[INFO]    Feature matching complete (12456 features matched)

4.3.2 高级参数调优

根据项目需求添加参数可显著提升输出质量。以下是最常用的优化参数:

4.3.2.1 提高重建精度

生成数字表面模型(DSM)并提高正射影像分辨率至2cm/像素

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project --dsm --orthophoto-resolution 2

4.3.2.2 处理大型数据集

启用分块处理,限制内存使用

docker run -ti --rm -v ~/datasets:/datasets opendronemap/odm --project-path /datasets/my_project --split 100 --max-concurrency 4

4.3.2.3 GPU加速(需NVIDIA显卡)

使用GPU加速特征提取,处理速度提升2-3倍

docker run -ti --rm -v ~/datasets:/datasets --gpus all opendronemap/odm:gpu --project-path /datasets/my_project --use-gpu

完整参数列表可通过docker run opendronemap/odm --help查看,常用参数速查表:

4.4 数据查看软件

4.4.1 正射影像与DEM查看(QGIS)

1. 下载安装

QGIS(国内用户建议使用OSGeo中国镜像)

2. 启动后点击"图层"→"添加图层"→"添加光栅图层"

3. 选择odm_orthophoto.tif文件,QGIS会自动识别地理坐标并定位

4.4.2 点云分析(CloudCompare)

1. 安装

CloudCompare

2. 打开软件后拖拽odm_georeferenced_model.laz文件到窗口

3. 使用快捷键:

4. W:切换线框/实体显示

5. E:调整点大小

6. Ctrl+F:启用颜色映射,按高程着色

4.4.3 三维模型查看(MeshLab)

 1. 安装

MeshLab

2. 打开odm_textured_model.obj文件

3. 右键点击模型→"渲染"→"纹理"启用纹理显示

5. 常见问题解决与性能优化

1. 影像重叠不足:确保前向重叠>70%,旁向>60%,解决方案:重新规划航线或使用--min-num-features 8000参数

2. 内存不足:处理200张以上影像需16GB+内存,临时解决方案:--downsample 0.5降低分辨率

3. GPS数据缺失:部分无人机未记录GPS,解决方案:添加--no-gps参数

4. 影像模糊:运动模糊会导致特征匹配失败,建议飞行速度

5. 光照变化大:拍摄时光照条件不一致,使用--use-3dmesh-texturing参数

6. 磁盘空间不足:单个项目需5-15GB空间,清理odm_texturing目录可释放临时文件

7. Docker权限问题:Linux用户需加入docker用户组,执行sudo usermod -aG docker $USER

8. 中文字符路径:所有文件夹和文件名不能包含中文

9. 相机参数异常:执行exiftool images/*.jpg检查焦距信息是否存在

10. 网络超时:首次运行需下载依赖,建议使用国内镜像或加速服务

6. 参考资料:

https://blog.ZEEKLOG.net/gitblog_00189/article/details/151913607

https://segmentfault.com/a/1190000010612098

https://blog.ZEEKLOG.net/V_V_V_V_V_V/article/details/148581770

https://blog.ZEEKLOG.net/Hugh_W/article/details/144175562

Read more

2026 AI元年:AI原生重构低代码,开发行业迎来范式革命

2026 AI元年:AI原生重构低代码,开发行业迎来范式革命

前言         2026 年,被全球科技产业正式定义为AI 规模化落地元年。 从实验室走向生产线、从对话交互走向系统内核、从锦上添花的功能插件走向底层驱动引擎,AI 不再是概念炒作,而是重构软件研发、企业服务、数字化转型的核心生产力。低代码开发平台,作为过去十年企业数字化落地最轻量化、最普及的工具,在 2026 年迎来最彻底的一次变革:AI 全面注入低代码,从 “可视化拖拽” 迈向 “意图驱动生成”。         长期以来,低代码行业始终面临两大争议:一是被技术开发者嘲讽 “只能做玩具系统,无法支撑企业级复杂场景”;二是被业务人员抱怨 “依旧需要懂技术、配规则、调逻辑,门槛依然很高”。而随着大模型技术成熟、国产模型规模化商用、AI 工程化能力落地,这一切正在被改写。         JNPF 作为企业级低代码平台的代表,在 2026 年全面完成 AI 原生架构升级,深度对接 Deepseek、通义千问、

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践

PyTorch实战——基于文本引导的图像生成技术与Stable Diffusion实践 * 0. 前言 * 1. 基于扩散模型的文本生成图像 * 2. 将文本输入编码为嵌入向量 * 3. 条件 UNet 模型中的文本数据融合机制 * 4. 使用 Stable Diffusion 模型生成图像 * 相关链接 0. 前言 在本节中,我们将为扩散模型添加文本控制能力。学习如何通过文字描述来引导图像生成过程,实现从"纯噪声+文本"生成图像,而不仅是从纯噪声生成。 1. 基于扩散模型的文本生成图像 在扩散模型的 UNet 模型训练流程中,我们仅训练模型从含噪图像中预测噪声。为实现文生图功能,需使用以下架构,将文本作为额外输入注入 UNet 模型: 这样的 UNet 模型称为条件 UNet 模型 ,或者更精确地说,是文本条件 UNet

AI工具前端提示词实战:从设计原则到工程化落地

快速体验 在开始今天关于 AI工具前端提示词实战:从设计原则到工程化落地 的探讨之前,我想先分享一个最近让我觉得很有意思的全栈技术挑战。 我们常说 AI 是未来,但作为开发者,如何将大模型(LLM)真正落地为一个低延迟、可交互的实时系统,而不仅仅是调个 API? 这里有一个非常硬核的动手实验:基于火山引擎豆包大模型,从零搭建一个实时语音通话应用。它不是简单的问答,而是需要你亲手打通 ASR(语音识别)→ LLM(大脑思考)→ TTS(语音合成)的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说,这是个绝佳的练手项目。 从0到1构建生产级别应用,脱离Demo,点击打开 从0打造个人豆包实时通话AI动手实验 AI工具前端提示词实战:从设计原则到工程化落地 在开发AI工具前端时,提示词系统往往是决定用户体验的关键因素。经过多个项目的实战积累,我总结了开发者最常遇到的三大痛点: 1. 语义歧义:自然语言提示词在不同场景下可能产生多种解析结果,导致AI返回不可预期的内容 2. 上下文丢失:

Llama-3.2V-11B-cot部署教程:GPU显存占用优化技巧与batch size调优实测

Llama-3.2V-11B-cot部署教程:GPU显存占用优化技巧与batch size调优实测 1. 引言:为什么你的GPU总是不够用? 如果你尝试过部署Llama-3.2V-11B-cot这个视觉推理模型,大概率会遇到一个让人头疼的问题:显存不够用。明明模型参数只有11B,为什么一运行就提示OOM(内存溢出)?为什么别人的服务器能流畅运行,你的却频频报错? 这其实不是模型本身的问题,而是部署时没有做好显存优化。今天这篇文章,我就来手把手教你如何优化Llama-3.2V-11B-cot的GPU显存占用,并通过实测数据告诉你,不同的batch size设置会带来多大的性能差异。 学习目标: * 理解Llama-3.2V-11B-cot的显存占用原理 * 掌握多种显存优化技巧 * 学会通过batch size调优平衡性能和显存 * 获得可立即使用的优化配置方案 前置知识:只需要基本的Python和命令行操作经验,不需要深度学习专家级知识。我会用最直白的方式解释所有概念。 2. 理解Llama-3.2V-11B-cot的显存占用 在开始优化之前,我们先要搞清楚