论文笔记:Point Cloud Forecasting as a Proxy for 4D Occupancy Forecasting(1)

论文笔记:Point Cloud Forecasting as a Proxy for 4D Occupancy Forecasting(1)

方法

车队会记录大量未标注的序列LiDAR点云X−T:T\textbf{X}_{-T:T}X−T:T​,同时记录每一帧的传感器位置o−T:T\textbf{o}_{-T:T}o−T:T​,我们将X−T:0\textbf{X}_{-T:0}X−T:0​和o−T:0\textbf{o}_{-T:0}o−T:0​记录为历史部分,X1:T\textbf{X}_{1:T}X1:T​和o1:T\textbf{o}_{1:T}o1:T​记录为未来部分

标准的点云预测办法ggg,将过去点云作为输入,来预测未来点云:X^1:T=g(X−T:0)\hat{\textbf{X}}_{1:T}=g(\text{X}_{-T:0})X^1:T​=g(X−T:0​)(1)(1)(1)

我们的方法将未来LiDAR点云x∈Xt,t=1...T\textbf{x} \in \textbf{X}_t, t = 1 ... Tx∈Xt​,t=1...T重参数化成一条射线:该射线从传感器位置ot\textbf{o}_tot​出发,沿方向d\textbf{d}d,经过距离λ\lambdaλ后到达终点x\textbf{x}x:x=ot+λd,x∈Xt\textbf{x} = \textbf{o}_t + \lambda \textbf{d}, \textbf{x} \in \textbf{X}_tx=ot​+λd,x∈Xt​(2)(2)(2)

我们的方法fff在未来时间ttt选取一条通过原点和方向(ot,d)(\textbf{o}_t, \textbf{d})(ot​,d)进行参数化的射线。然后在给定过去点云X−T:0\textbf{X}_{-T:0}X−T:0​和传感器位置o−T:0\textbf{o}_{-T:0}o−T:0​的情况下,预测射线经过距离λ^\hat{\lambda}λ^:λ^=f(ot,d;X−T:0,o−T:0)\hat{\lambda}=f(\textbf{o}_t, \textbf{d}; \textbf{X}_{-T:0}, \textbf{o}_{-T:0})λ^=f(ot​,d;X−T:0​,o−T:0​)(3)(3)(3)

公式(3)与Nerf类似,Nerf预测颜色,本文预测深度

Spacetime (4D) occupancy

将spacetime occupancy定义为特定时间点的3D位置占用状态。使用z\textbf{z}z来表示真实的spacetime occupancy,由于视线可见性的限制,可能无法直接进行观测。给定一个有界时空4D volume V\mathcal{V}V,该volume被离散为时空voxel v\textbf{v}v。可以使用z[v]∈{0,1},v=(x,y,z,t),v∈V\textbf{z}[\textbf{v}] \in \{0, 1\}, \textbf{v}=(x, y, z, t), \textbf{v}\in \mathcal{V}z[v]∈{0,1},v=(x,y,z,t),v∈V(4)(4)(4)来表示时空voxel grid V\mathcal{V}V中voxel v\textbf{v}v的占用状态,该状态可以是占用(1)或者空闲(0)。

我们通过学习一个占用预测网络hhh(由w\textbf{w}w进行定义),根据历史点云和传感器位置来预测离散化的四维时空占用:z^=h(X−T:0,o−T:0;w)\hat{\textbf{z}}=h(\textbf{X}_{-T:0}, \textbf{o}_{-T:0}; \textbf{w})z^=h(X−T:0​,o−T:0​;w)(5)(5)(5),其中z^[v]∈R[0,1]\hat{\textbf{z}}[\textbf{v}] \in \mathbb{R}_{[0, 1]}z^[v]∈R[0,1]​表示预测的占用

Depth rendering from occupancy

给定射线query x=o+λd\textbf{x}=\textbf{o}+\lambda \textbf{d}x=o+λd,目标是预测λ^\hat{\lambda}λ^与真实λ\lambdaλ尽可能接近。我们首先通过voxel遍历计算其与占用grid的交集(Fig 4)。假定射线和列表voxels{v1...vn}\{\textbf{v}_1... \textbf{v}_n\}{v1​...vn​}相交。假设射线只能停在voxel的边界或者无限远处,从而对射线空间进行离散化,我们将voxel vi\textbf{v}_ivi​解释为从voxel vi−1\textbf{v}_{i-1}vi−1​发出的射线在voxel vi\textbf{v}_ivi​停止的条件概率,可以写为:pi=∏j=1i−1(1−z^[vj])z^[vi]p_i = \prod_{j=1}^{i-1} (1 - \hat{\textbf{z}}[\textbf{v}_j]) \hat{\textbf{z}}[\textbf{v}_i]pi​=∏j=1i−1​(1−z^[vj​])z^[vi​],其中pip_ipi​表示射线停在voxel vi\textbf{v}_ivi​的概率。现在可以通过计算期望中的停止点来渲染距离λ^=f(o,d)=∑i=1npiλ^i\hat{\lambda} = f(\textbf{o}, \textbf{d}) = \sum_{i=1}^{n}p_i\hat{\lambda}_iλ^=f(o,d)=∑i=1n​pi​λ^i​,λ^i\hat{\lambda}_iλ^i​表示voxel vi\textbf{v}_ivi​的停止距离。

在这里插入图片描述


从上式可看出不考虑射线停在voxel grid外面的情况,该停止距离未定义(将在无限远处停止)。在训练时,在真实的grid外部设置一个虚拟的停止点:
λ^=f(o,d)=∑i=1npiλ^i+∏i=1n(1−pi)λ^n+1\hat{\lambda} = f(\mathbf{o}, \mathbf{d}) = \sum_{i=1}^{n} p_i \hat{\lambda}_i + \prod_{i=1}^{n} (1 - p_i) \hat{\lambda}_{n+1}λ^=f(o,d)=∑i=1n​pi​λ^i​+∏i=1n​(1−pi​)λ^n+1​,其中λ^n+1=λ\hat{\lambda}_{n+1} = \lambdaλ^n+1​=λ.

Loss function

使用L1 loss来训练occupancy prediction network:
L(w)=∑(o,λ,d)∈(X1:T,o1:T)∣λ−f(o,d;X−T:0,o−T:0,w)∣L(\mathbf{w}) = \sum_{(\mathbf{o}, \lambda, \mathbf{d}) \in (\mathcal{X}_{1:T}, \mathbf{o}_{1:T})} \left| \lambda - f(\mathbf{o}, \mathbf{d}; \mathbf{X}_{-T:0}, \mathbf{o}_{-T:0}, \mathbf{w}) \right|L(w)=∑(o,λ,d)∈(X1:T​,o1:T​)​∣λ−f(o,d;X−T:0​,o−T:0​,w)∣

Read more

GitHub 上开源了 30+ 个 OpenClaw 真实使用案例。

最近逛 GitHub 的时候发现了一个挺有意思的仓库,专门收集 OpenClaw 的 usecases。 说实话,很多人装完 OpenClaw 之后的操作都是一样的:疯狂往里面塞各种 Skill,ClawHub 逛得跟菜市场一样热闹,今天装个天气查询,明天装个股票分析,后天又来个翻译助手。 结果装了一堆却发现每天还是在信息搜索、做个记录。Skill 装了一百个,生活一点没变轻松。 这个开源项目就是专门收集人们真实在用的 OpenClaw 场景,而不是单纯介绍某个 Skill 或插件。 01 开源项目简介 awesome-openclaw-usecases 目前收录了 30 多个经过验证的真实使用场景。 它的核心理念非常简单:不是教你装什么 Skill,而是告诉你别人是怎么把 OpenClaw 变成真正能帮人类干活的私人助理的。 如果你不知道 OpenClaw 具体能做什么,只停留在抽象概念。有一些自动化或搭建 AI 智能体想法,但不知道如何系统落地,想参考别人已经跑通的真实工作流和自动化方案。

By Ne0inhk
Trae x Vizro:低代码构建专业数据可视化仪表板的高效方案

Trae x Vizro:低代码构建专业数据可视化仪表板的高效方案

声明:文章为本人真实测评博客,非广告,并没有推广该平台 ,为用户体验文章 目录 * 前言 * 一.核心工具与优势解析 * 低代码高效开发 * 专业视觉设计 * 高度灵活可定制 * AI赋能创新 * 二.操作步骤:从安装到生成效果 * 第一步. 获取MCP配置代码 * 第二步:下载 * 第三步:在 Trae 中导入 MCP 配置并建立连接 * 三. 实战:用Vizro MCP快速构建仪表板 * 1. 提出需求 * 2.智能体生成代码 * 3.查看运行结果 * 4.优化与部署 * 四.Vizro MCP核心功能解析 * get_vizro_chart_or_dashboard_plan * get_model_json_

By Ne0inhk

无人机“黑飞”正式入法:2026年1月1日起违规飞行将面临拘留

无人机"黑飞"正式入法:2026年1月1日起违规飞行将面临拘留 一、新规核心内容 2025年6月27日,十四届全国人大常委会第十六次会议表决通过新修订的《中华人民共和国治安管理处罚法》,明确将无人机"黑飞"列为"妨害公共安全的行为",自2026年1月1日起正式实施。 法律依据:新《治安管理处罚法》第46条规定:"违反有关法律法规关于飞行空域管理规定,飞行民用无人驾驶航空器、航空运动器材,或者升放无人驾驶自由气球、系留气球等升空物体,情节较重的,处五日以上十日以下拘留。" 特别严重情形(如非法穿越边境线):最高可处十日以上十五日以下拘留。 二、"黑飞"的法律定义 **无人机"黑飞"**是指违反《无人驾驶航空器飞行管理暂行条例》等法律法规的无人机飞行活动,具体包括: 1.

By Ne0inhk

Windows 10/11 部署 OpenClaw 完全指南:从环境搭建到机器人互联

摘要:本文详细介绍了在 Windows x64 架构下部署开源机器人控制框架 OpenClaw 的完整流程。针对 Windows 平台特有的 C++ 编译环境难题(sharp 库依赖),提供了“一键脚本”与“手动安装”双重解决方案,并深入解析了云端大模型配置与局域网稳定连接的核心技巧,助您快速打造高性能的机器人控制中枢。 📋 前言:为什么选择 Windows 部署? OpenClaw 是一个强大的开源机器人控制框架,支持语音交互、视觉感知与大模型决策。虽然 macOS 是开发者的首选,但 Windows 10/11 (x64) 凭借广泛的硬件兼容性和强大的 GPU 生态,同样是部署 OpenClaw 的优秀平台。 核心挑战: Windows 环境下最大的痛点在于 C++ 编译环境。OpenClaw 依赖的高性能图像处理库

By Ne0inhk