Python

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

综述由AI生成汇总了**具身导航**的论文，供大家参考学习，涵盖2026、2025、2024、2023等覆盖的会议和期刊：CVPR、IROS、ICRA、RSS、arXiv等等论文和方法会持续更新的～一、🏠 中文标题版 **2026** ✨ \[2026\] SeqWalker：基于分层规划的时序视野视觉语言导航方法 \ [论文 \] \ [GitHub \] \[2026\] UrbanNav：从网…

不知所云发布于 2026/4/7更新于 2026/5/2240K 浏览

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

本文汇总了具身导航的论文，供大家参考学习，涵盖2026、2025、2024、2023等

覆盖的会议和期刊：CVPR、IROS、ICRA、RSS、arXiv等等

论文和方法会持续更新的～

一、🏠 中文标题版

2026 ✨

[2026] SeqWalker：基于分层规划的时序视野视觉语言导航方法 [ 论文 ] [ GitHub ]
[2026] UrbanNav：从网络规模人类轨迹中学习语言引导的城市导航方法 [ 论文 ] [ GitHub ]
[2026] VLN-MME：面向语言引导视觉导航智能体的多模态大语言模型诊断基准 [ 论文 ] [ GitHub ]
[2026] ASCENT: 实现楼层感知的零样本物体目标导航 [ 论文] [ GitHub ]

2025 😆

[2025] ETP-R1：面向连续环境VLN的进化拓扑规划与强化微调方法 [ 论文 ] [ GitHub ]
[2025] NaviTrace：评估视觉语言模型在真实世界场景中的导航能力 [ 论文 ] [ GitHub ]
[2025] AstraNav-World：面向具身导航的物理一致性世界模型 [ 论文 ] [ GitHub ]
[2025] OneMap：面向零样本多目标导航的实时开放词汇建图方法 [ 论文 ] [ GitHub ]
[2025] VLNVerse：面向视觉语言导航的通用化具身真实仿真与评估基准 [ 论文 ] [ ]

[2024] E2Map：基于语言模型的自反思机器人导航体验与情感地图 [论文] [GitHub]
[2024] 移动机器人对大规模室内环境的自主探索和语义更新 [论文] [GitHub]
[2024] 通过像素引导导航技能连接零样本目标导航和基础模型 [论文] [GitHub]
[2024] InstructNav：未探索环境中通用指令导航的零样本系统 [论文] [GitHub]
[2024] NaVILA：用于导航的腿式机器人视觉 - 语言 - 行动模型[论文] [GitHub]
[2024] ReMEmbR：用于机器人导航的长视界时空记忆构建与推理 [[论文] [GitHub]
[2024] Aim My Robot：对任何物体的精准局部导航 [论文]
[2024] 标签地图：基于文本的地图用于空间推理和导航与大型语言模型 [论文] [项目页面]
[2024] MapGPT：用于视觉 - 语言导航的基于地图引导的提示与自适应路径规划 [论文] [GitHub]
[2024] CANVAS：用于直观人机交互的常识感知导航系统 [论文] [GitHub]
[2024] VLFM：用于零样本语义导航的视觉 - 语言前沿地图 [论文] [GitHub]
[2024] 注意错误！检测和定位视觉 - 语言导航中的指令错误 [论文] [GitHub]
[2024] 从想象中规划：用于视觉 - 语言导航的情景模拟和情景记忆 [论文]
[2024] MC-GPT：通过记忆地图和推理链增强的视觉 - 语言导航 [论文]
[2024] 持续的视觉 - 语言导航 [论文]
[2024] Open-Nav：使用开源大型语言模型在连续环境中探索零样本视觉 - 语言导航 [论文]
[2024] 查找一切：多目标搜索的通用视觉语言模型方法 [论文] [GitHub]
[2024] NavGPT：在视觉 - 语言导航中使用大型语言模型进行显式推理 [论文] [GitHub]
[2024] NavGPT-2：释放大型视觉 - 语言模型的导航推理能力 [论文] [GitHub]
[2024] 带有神经辐射表示的前瞻探索用于连续视觉 - 语言导航 [论文] [GitHub]
[2024] 通过 3D 特征场实现视觉 - 语言导航的仿真到现实转移 [论文] [GitHub]
[2024] LangNav：将语言作为导航的感知表示 [论文] [GitHub]
[2024] 使用大型语言模型模块化构建协作具身智能体 [论文] [GitHub]
[2024] Navid：基于视频的 VLM 规划视觉和语言导航的下一步 [ 论文 ]
[2024] The One RING：机器人室内导航通才 [ 论文 ]
[2024] Mobility VLA：基于长上下文 VLM 和拓扑图的多模态指令导航 [ 论文 ]

[2025] 3D-Mem: 3D Scene Memory for Embodied Exploration and Reasoning [ 论文] [ 项目 ]
[2025] EfficientEQA: An Efficient Approach for Open Vocabulary Embodied Question Answering [ 论文 ]
[2025] Learned Perceptive Forward Dynamics Model for Safe and Platform-aware Robotic Navigation [paper] [project]
[2025] Semantic Mapping in Indoor Embodied AI - A Comprehensive Survey and Future Directions [paper]
[2025] VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning [paper]
[2025] TRAVEL: Training-Free Retrieval and Alignment for Vision-and-Language Navigation [paper]
[2025] VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion [paper]
[2025] NavigateDiff: Visual Predictors are Zero-Shot Navigation Assistants [paper]
[2025] MapNav: A Novel Memory Representation via Annotated Semantic Maps for VLM-based Vision-and-Language Navigation [paper]
[2025] OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation [paper]
[2025] Ground-level Viewpoint Vision-and-Language Navigation in Continuous Environments [paper]
[2025] WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation [paper] [project]
[2025] Dynamic Path Navigation for Motion Agents with LLM Reasoning [paper]
[2025] SmartWay: Enhanced Waypoint Prediction and Backtracking for Zero-Shot Vision-and-Language Navigation [paper]
[2025] Vi-LAD: Vision-Language Attention Distillation for Socially-Aware Robot Navigation in Dynamic Environments [paper]
[2025] UniGoal: Towards Universal Zero-shot Goal-oriented Navigation [paper] [project]
[2025] PanoGen++: Domain-Adapted Text-Guided Panoramic Environment Generation for Vision-and-Language Navigation [paper]
[2025] Do Visual Imaginations Improve Vision-and-Language Navigation Agents? [paper] [project]
[2025] HA-VLN: A Benchmark for Human-Aware Navigation in Discrete-Continuous Environments with Dynamic Multi-Human Interactions, Real-World Validation, and an Open Leaderboard [paper] [project]
[2025] FlexVLN: Flexible Adaptation for Diverse Vision-and-Language Navigation Tasks [paper]
[2025] P3Nav: A Unified Framework for Embodied Navigation Integrating Perception, Planning, and Prediction [paper]
[2025] Unseen from Seen: Rewriting Observation-Instruction Using Foundation Models for Augmenting Vision-Language Navigation [paper] [project]
[2025] COSMO: Combination of Selective Memorization for Low-cost Vision-and-Language Navigation [paper]
[2025] ForesightNav: Learning Scene Imagination for Efficient Exploration [paper] [project]
[2025] CityNavAgent: Aerial Vision-and-Language Navigation with Hierarchical Semantic Planning and Global Memory [paper] [project]
[2025] NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance [paper]
[2025] VISTA: Generative Visual Imagination for Vision-and-Language Navigation [paper]
[2025] Dynam3D: Dynamic Layered 3D Tokens Empower VLM for Vision-and-Language Navigation [paper] [project]
[2025] Aux-Think: Exploring Reasoning Strategies for Data-Efficient Vision-Language Navigation [paper]

[2024] [RSS 24] Navid: Video-based vlm plans the next step for vision-and-language navigation [paper]
[2024] [RSS 24] NaVILA: Legged Robot Vision-Language-Action Model for Navigation [paper]
[2024] The One RING: a Robotic Indoor Navigation Generalist [paper]
[2024] Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs [paper]
E2Map: Experience-and-Emotion Map for Self-Reflective Robot Navigation with Language Models [Paper][GitHub]
Autonomous Exploration and Semantic Updating of Large-Scale Indoor Environments with Mobile Robots [Paper][GitHub]
Bridging Zero-shot Object Navigation and Foundation Models through Pixel-Guided Navigation Skill [Paper][GitHub]
InstructNav: Zero-shot System for Generic Instruction Navigation in Unexplored Environment [Paper][GitHub]
NaVILA: Legged Robot Vision-Language-Action Model for Navigation [Paper][GitHub]
ReMEmbR: Building and Reasoning Over Long-Horizon Spatio-Temporal Memory for Robot Navigation [Paper][GitHub]
Aim My Robot: Precision Local Navigation to Any Object [Paper]
Tag Map: A Text-Based Map for Spatial Reasoning and Navigation with Large Language Models [Paper][Project Page]
Adaptive Zone-aware Hierarchical Planner for Vision-Language Navigation [Paper][GitHub]
MapGPT: Map-Guided Prompting with Adaptive Path Planning for Vision-and-Language Navigation [Paper][GitHub]
CANVAS: Commonsense-Aware Navigation System for Intuitive Human-Robot Interaction [Paper][GitHub]
VLFM: Vision-Language Frontier Maps for Zero-Shot Semantic Navigation [Paper][GitHub]
Mind the Error! Detection and Localization of Instruction Errors in Vision-and-Language Navigation [Paper][GitHub]
Planning from Imagination: Episodic Simulation and Episodic Memory for Vision-and-Language Navigation [Paper]
MC-GPT: Empowering Vision-and-Language Navigation with Memory Map and Reasoning Chains [Paper]
Continual Vision-and-Language Navigation [Paper]
Open-Nav: Exploring Zero-Shot Vision-and-Language Navigation in Continuous Environment with Open-Source LLMs [Paper]
Find Everything: A General Vision Language Model Approach to Multi-Object Search [Paper][GitHub]
NavGPT: Explicit Reasoning in Vision-and-Language Navigation with Large Language Models [Paper][GitHub]
NavGPT-2: Unleashing Navigational Reasoning Capability for Large Vision-Language Models [Paper][GitHub]
Lookahead Exploration with Neural Radiance Representation for Continuous Vision-Language Navigation [Paper][GitHub]
Sim-to-Real Transfer via 3D Feature Fields for Vision-and-Language Navigation [Paper][GitHub]
LangNav: Language as a Perceptual Representation for Navigation [Paper][GitHub]
Building Cooperative Embodied Agents Modularly with Large Language Models [Paper][GitHub]

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

一、🏠 中文标题版

2025 😆

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

一、🏠 中文标题版

2025 😆

更多推荐文章

相关免费在线工具

2024 😄

2023 😲

二、🔄 英文原版

2025 🐻

2024 🐵

2023 🦆

更多推荐文章

相关免费在线工具

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

一、🏠 中文标题版

2025 😆

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

一、🏠 中文标题版

2025 😆

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

2024 😄

2023 😲

二、🔄 英文原版

2025 🐻

2024 🐵

2023 🦆

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具