小鹏VLA 2.0的“神秘涌现”:从痛苦到突破,自动驾驶与机器人如何突然“开窍”?

小鹏VLA 2.0的“神秘涌现”:从痛苦到突破,自动驾驶与机器人如何突然“开窍”?

大家好,我是数据与算法架构提升之路,专注于AI、自动驾驶和机器人领域的最新动态。今天,我们来聊聊小鹏汽车在2025科技日上爆出的重磅消息:VLA 2.0和人形机器人IRON的“涌现”过程。这不仅仅是技术迭代,更是像科幻小说一样的突然“觉醒”。如果你对自动驾驶的未来感兴趣,这篇文章绝对值得一读!我们将基于小鹏自动驾驶负责人刘先明和机器人副总裁米良川的独家对话,揭秘背后的故事。

  • 刘先明 | 小鹏汽车自动驾驶负责人
于2016年博士毕业于伊利诺伊大学厄巴纳-香槟分校(UIUC),曾在Facebook(现Meta)、Cruise任职,从事机器学习与计算机视觉领域的前沿研究工作。现全面负责小鹏汽车自动驾驶中心业务和组织管理工作。
  • 米良川 | 小鹏汽车机器人副总裁及AI技术委员会负责人
他是机器人与AI领域的资深专家。曾在NVIDIA任职十余年,有深厚的GPU并行计算、移动计算、深度学习及自动驾驶技术功底;并曾于CMU机器人研究所深造,且拥有创办机器人公司的实践经验。

涌现的奇迹:从失败边缘到全新大陆

想象一下:一个项目经历了数月的失败,团队内部甚至多次讨论是否要停掉它。突然有一天,一切都变了——系统自己学会了此前难以攻克的场景,步态僵硬的机器人瞬间走得像真人一样。这就是小鹏VLA 2.0的“涌现”过程,何小鹏在2025科技日上形容它“极其突然”。

刘先明透露,小鹏从2024年起投入了3万张卡的算力,烧掉20多亿训练费用。直到今年二季度某一天,模型发生了巨大跳跃。但这不是运气,而是坚持“第一性原理”的结果:简化架构,告别复杂计算,直接用真实世界数据训练。结果?模型不再需要数据标注,就能泛化到新城市甚至海外市场。

一个惊喜案例:测试车在红灯即将转绿时,会缓缓向前蠕动,就像人类预备起步。更牛的是,即使前方灯没变,它也能通过两侧灯的变化推测。这不是人为教的,而是数据量大到一定程度,自然“理解”了。

VLA 2.0的核心秘密:为什么甩掉“Language”?

VLA(Vision-Language-Action)是自动驾驶的核心,但传统架构有三大痛点:

  1. 输入信号损失:从视频到离散Token,信息大量丢失。
  2. 输出连续性:控制信号是连续的,无法简单离散化。
  3. 缺乏真实反馈:强化学习往往被简化成监督微调,没法模拟物理世界。

小鹏的解决方案?拆掉“Language”部分,直接从Vision到Action!刘先明强调:“简单就是美。”输入用真实视频流,输出用连续信号,网络结构极简。文字作为Token输入,但去掉了图文对模块,训练效率大幅提升。

结果:不需要任何指令,就能实现园区漫游。部署时,直接内嵌推理逻辑,去掉云端计算,完美适配量产车。

量产部署的硬核优化:本地化、低延时

世界模型计算庞大,但小鹏VLA 2.0实现了本地部署。刘先明介绍,他们从模型到软件,再到编译器和硬件联合优化,让大规模模型在图灵芯片上实时运行,与摄像头帧率一致。传统方法如剪枝、蒸馏、量化当然用了,但关键是“榨取每一比特算力”。

激光雷达?小鹏说:不会装回来了!

Robotaxi会用激光雷达吗?刘先明一口否定:“为什么一定要用?”激光雷达扫描频率仅10Hz,高功率不符合车规,雨雾天气还易噪点。相反,摄像头信息量巨大(500-800万像素,三通道8比特),过去算法弱才依赖激光。现在,优化算法后,摄像头远超激光。

他指出,摄像头原始数据28比特,转RGB时损失16比特,但通过更好算法,能在暗光、逆光环境下捕捉更多信息。小鹏坚信纯视觉端到端是未来。

人形机器人IRON:从焦虑到惊艳“涌现”

转向机器人,小鹏的IRON同样经历了“涌现”。米良川回忆,4月上海车展前一个月,团队还为步态僵硬焦虑。但3月某晚,IRON在倒退行走时突然拟人化!这是生成式控制器的拐点,数据和算力积累的结果。

IRON的秘密:

  • 脊柱设计:不是简单腰部,而是仿人类“脊柱+肌肉群+腹腔+皮肤”,自由度更高。
  • 前脚掌自由度:加上生成式控制器,实现大师级太极、叶问蹲。
  • 第四代控制器:“反重力器”,对抗重力本质,输入连续姿态,就能执行动作。

米良川认为,机器人能力是“螺旋上升”:从30分场景应用,解决问题到40分,再循环。未来,IRON不只工具,还能情感链接——甚至做成亲人模样。

IRON丝滑打太极,步态超拟人,让人怀疑“里面是不是真人”?

涌现背后的启示:坚持与上限

刘先明和米良川的对话,让我们看到“涌现”不是玄学,而是投入+原理的产物。小鹏倾全公司资源自研机器人(除了螺丝),证明了VLA在操纵上的潜力。米良川说:“发展缓慢,但上限高。人类100分,机器人至少80分才能进家庭。”

结语:自动驾驶与机器人的新时代

小鹏的VLA 2.0和IRON,标志着AI从“模仿”到“涌现”的跃迁。这不只技术故事,更是关于坚持的励志篇。未来,自动驾驶无标注泛化,机器人情感陪伴,都指日可待。

Read more

【C++ 进阶】继承(上):解锁代码复用的核心密码,体会代码复用的魅力!

【C++ 进阶】继承(上):解锁代码复用的核心密码,体会代码复用的魅力!

前言:C++的三大核心特性是封装、继承和多态。在前文中,我们已经通过类和对象讲解了封装特性。接下来,本文将深入探讨C++继承机制的奥秘。 🌟 专注用图文结合拆解难点+代码落地知识,让技术学习从「难懂」变“一看就会”! 🏠 个人主页 :MSTcheng · ZEEKLOG 💻 代码仓库 :MSTcheng · Gitee📚 精选专栏 :📖 :《C语言》🧩 :《数据结构》💡 :《C++由浅入深》💬 座右铭 :“路虽远行则将至,事虽难做则必成!” 文章目录 * 一、继承的概念及定义 * 1.1继承的概念 * 1.2继承的定义 * 1.3继承方式与访问方式的组合 * 1.4继承类模板 * 二、基类和派生类对象的赋值转换 * 三、继承中的作用域 * 3.1隐藏规则 * 3.2继承作用域的两道笔试题 * 四、总结

By Ne0inhk
C++波澜壮阔40年|类和对象篇:拷贝构造与赋值重载的演进与实现

C++波澜壮阔40年|类和对象篇:拷贝构造与赋值重载的演进与实现

🔥@雾忱星: 个人主页 👀专栏:《数据结构与算法入门指南》、《C++学习之旅》 💪学习阶段:C/C++、数据结构与算法 ⏳“人理解迭代,神理解递归。” 文章目录 * 引言 * 一、拷贝构造函数 * 1.1 解析:拷贝构造特点 * 1.2 关键:拷贝构造的调用 * 二、赋值运算符重载 * 2.1 铺垫:运算符重载特点 * 2.1.1 核心:理解运算符重载 * 2.2 进阶:赋值运算符重载特点 * 2.2 核心:理解赋值运算符重载 * 总结 引言 在C++面向对象编程中,对象的复制操作无处不在。无论是函数传参、返回值传递,

By Ne0inhk
【C++:智能指针】没有垃圾回收?智能指针来也!破解C++内存泄漏:智能指针原理、循环引用与线程安全详解

【C++:智能指针】没有垃圾回收?智能指针来也!破解C++内存泄漏:智能指针原理、循环引用与线程安全详解

🎬 个人主页:艾莉丝努力练剑 ❄专栏传送门:《C语言》《数据结构与算法》《C/C++干货分享&学习过程记录》 《Linux操作系统编程详解》《笔试/面试常见算法:从基础到进阶》《Python干货分享》 ⭐️为天地立心,为生民立命,为往圣继绝学,为万世开太平 🎬 艾莉丝的简介: 🎬 艾莉丝的C++专栏简介: 文章目录 * C++学习阶段的三个参考文档 * 1 ~> 前言:智能指针的使用场景 * 2 ~> RAII和智能指针的设计思路 * 2.1 理论:RAII * 2.2 最佳实践 * 2.3 实践RAII:核心思想 * 3 ~> C++标准库智能指针的使用 * 3.1 理论

By Ne0inhk
C++ 面试题常用总结 详解(满足c++ 岗位必备,不定时更新)

C++ 面试题常用总结 详解(满足c++ 岗位必备,不定时更新)

📚 本文主要总结了一些常见的C++面试题,主要涉及到语法基础、STL标准库、内存相关、类相关和其他辅助技能,掌握这些内容,基本上就满足C++的岗位技能(红色标记为重点内容),欢迎大家前来学习指正,会不定期去更新面试内容。  Hi~!欢迎来到碧波空间,平时喜欢用博客记录学习的点滴,欢迎大家前来指正,欢迎欢迎~~ ✨✨ 主页:碧波 📚 📚 专栏:C++ 系列文章 目录 一、C ++ 语法基础 🔥 谈谈变量的使用和生命周期,声明和初始化 🔥 谈谈C++的命名空间的作用 🔥  include " " 和 <> 的区别 🔥 指针是什么? 🔥 什么是指针数组和数组指针 🔥 引用是什么? 🔥 指针和引用的区别 🔥 什么是函数指针和指针函数以及区别 🔥 什么是常量指针和指针常量以及区别 🔥 智能指针的本质是什么以及实现原理 🔥 weak_ptr 是否有计数方式,在那分配空间? 🔥 类型强制转换有哪几种? 🔥 函数参数传递时,

By Ne0inhk