跳到主要内容
极客日志极客日志面向AI+效率的开发者社区
首页博客GitHub 精选镜像工具UI配色美学隐私政策关于联系
搜索内容 / 工具 / 仓库 / 镜像...⌘K搜索
注册
博客列表
编程语言AI算法

Google 发布 2020 图像匹配基准与挑战赛

Google 地图研究员联合多所高校发布跨宽基线图像匹配基准。该基准基于 CVPR 2019 研讨会成果,包含超过 25,000 张带有精确成像方位信息的图像。旨在评估 3D 重建方法,支持从互联网非结构化图像中恢复 3D 结构。挑战赛以此为基础,解决用户图像视角、光照及遮挡带来的重建难题。

不羁发布于 2020/4/14更新于 2026/6/419 浏览
Google 发布 2020 图像匹配基准与挑战赛

从一系列图像中重建 3D 物体和建筑物是计算机视觉中众所周知的一类问题,这类问题也被称为运动推断结构 (Structure-from-Motion, SfM)。

SfM 在摄影和文化遗产保护方面有着多种应用(如:让人们在浏览器中探索复活节岛上的神秘石像),并为 Google 地图中的多个服务提供支持,例如从街景和航拍图像创建 3D 模型。在这些示例中,操作员通常在受控条件下获取图像。虽然这样能够保证数据在图像和最终重建外观效果上高度统一,但也导致无法同时从多个地点获取图像,以及从多个视角查看对象。如果可以借助 SfM 技术,获取互联网上免费提供的大量非结构化图像集合,而不是使用有严格控制条件的图像,是否能更好展现这个丰富多彩的世界呢?

如何加速对这一主题以及更好地利用已公开的大量数据的研究,我们与 UVIC、CTU 和 EPFL 展开合作,发表了题为《跨宽基线的图像匹配:从论文到实践》(Image Matching across Wide Baselines: From Paper to Practice) 的论文,其中提出了用于评估 3D 重建方法的全新公开基准。在 CVPR 2019 举行的首次图像匹配:局部特征及其他研讨会的结果基础上,该项目现已包含超过 25,000 张图像,每张图像都包含准确的成像方位信息(地点和方向)。该数据以及论文提出的开源基准是 CVPR 2020 举办的 2020 年图像匹配挑战赛的基础内容,两者都已公开。

从混乱的图像中恢复 3D 结构

Google 地图已开始使用用户提供的图像来告知游客热门景点或者更新营业时间。然而,使用这种类型的数据来构建 3D 模型要困难得多,因为用户提供的图像往往有不同的视角、光照和天气条件、人物和车辆的遮挡以及偶尔会出现的用户滤镜。下方的示例将着重说明用户拍摄的罗马特雷维喷泉图像的多样性:

特雷维喷泉的不同视角:来自图像匹配挑战赛数据集中的部分示例

通常,要想使用 SfM 重建 3D 场景,首先要确定这些图像中的哪些部分捕获了场景中相同的物理点,如窗户的一角。这一点可通过使用 局部特征(即图像在不同视图中都能可靠识别出的显著位置)来实现。局部特征包含捕获景点四周外观的简短描述向量(模型表征)。通过比较这些描述符,可以用两张或多张图像,在图像位置的像素坐标之间建立可能的对应关系,并通过三角测量来还原点的 3D 位置。然后,可以一同估算

目录

  1. 从混乱的图像中恢复 3D 结构
  • 💰 8折买阿里云服务器限时8折了解详情
  • Magick API 一键接入全球大模型注册送1000万token查看
  • 🤖 一键搭建Deepseek满血版了解详情
  • 一键打造专属AI 智能体了解详情
极客日志微信公众号二维码

微信扫一扫,关注极客日志

微信公众号「极客日志V2」,在微信中扫描左侧二维码关注。展示文案:极客日志V2 zeeklog

更多推荐文章

查看全部
  • RAG 系统实现指南:Langchain 与纯手搓方案对比
  • TD3 算法详解:双延迟深度确定性策略梯度
  • CSS 元素显示模式详解:块级、行内与行内块
  • Python 二氧化碳排放量数据分析系统
  • C 语言指针与数组的深度关联及实战应用
  • 分布式文件存储服务设计与实现优化
  • ROG 携超神 27 二代显示器与 AR 眼镜亮相 CES 2026
  • Java 自旋锁与读写锁详解
  • 双延迟深度确定性策略梯度算法 (TD3) 详解
  • 7 款 AI+Excel 高效工具推荐,提升数据分析效率
  • Qwen3-Embedding-4B 本地部署实战:llama.cpp 与 Open WebUI 集成
  • Spring Web MVC 核心概念与实战指南
  • GitHub Awesome Copilot 项目解析:社区驱动的 AI 编程助手增强工具库
  • Python 中使用 flashtext 模块进行关键词提取与替换
  • Z-Image-Turbo 驱动虚拟现实场景资产自动化生成路径
  • 大模型技术全景:架构、分类与核心应用场景
  • 25 个去 AI 味 Prompt 实战指南,降低检测率
  • LeetCode 1984. 最小化 K 个分数的最高与最低分差值
  • Llama 开源家族演进:从 Llama-1 到 Llama-3 深度解析
  • Mac 系统下 Anaconda 与 Python 环境安装完整指南

相关免费在线工具

  • 加密/解密文本

    使用加密算法(如AES、TripleDES、Rabbit或RC4)加密和解密文本明文。 在线工具,加密/解密文本在线工具,online

  • RSA密钥对生成器

    生成新的随机RSA私钥和公钥pem证书。 在线工具,RSA密钥对生成器在线工具,online

  • Mermaid 预览与可视化编辑

    基于 Mermaid.js 实时预览流程图、时序图等图表,支持源码编辑与即时渲染。 在线工具,Mermaid 预览与可视化编辑在线工具,online

  • 随机西班牙地址生成器

    随机生成西班牙地址(支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选),支持数量快捷选择、显示全部与下载。 在线工具,随机西班牙地址生成器在线工具,online

  • Gemini 图片去水印

    基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印,支持批量处理与下载。 在线工具,Gemini 图片去水印在线工具,online

  • Base64 字符串编码/解码

    将字符串编码和解码为其 Base64 格式表示形式即可。 在线工具,Base64 字符串编码/解码在线工具,online