逐际动力发布 LimX COSA 具身智能操作系统
逐际动力(LimX Dynamics)正式发布了名为 LimX COSA(Cognitive OS of Agents)的具身智能操作系统。这一系统旨在让机器人实现'边思考边干活',搭载该系统的全尺寸人形机器人 Oli 在无遥控、全自主的视频中展现了惊人的连续作业能力。
这项成果的核心意义在于从根本上解决了具身智能领域'知易行难'的痛点。它突破了传统机器人只能被动、分步执行预设程序的局限,使机器人能够自主理解任务、适应真实物理世界并可靠完成作业。这也意味着行业趋势正从单纯关注模型能力,转向关注 OS 系统能力,为技术 Demo 迈向产品交付铺平道路。
在全球竞争格局中,COSA 的独特性尤为凸显。不同于将'通用大脑'简单嫁接到机器人上的做法,COSA 选择了一条更接近生命智能本质的路径——从设计之初就将机器人本体与物理世界深度绑定,实现认知与行动的实时闭环。例如,Figure 发布的 Helix 本质上是一个强大的模型,而 COSA 则是一个完整的操作系统。打个比方,如果 Helix 是一个功能强大的 App,那 COSA 就是 Android 或 iOS 级别的系统平台,不仅能承载应用,还原生具备驱动物理 AI 的 Agent 能力。这种底层架构的差异直接体现在表现上:Helix 的 Demo 仍是'移动归移动、操作归操作'的分段式演示,而搭载 COSA 的 Oli 已经实现了'移动 - 操作 - 移动'的连续作业,真正做到一镜到底的'边想边做'。
具身 Agentic OS 架构:大小脑融合的物理世界原生系统
长久以来,机器人的'认知'(大脑)和'运动'(小脑)往往是分裂的。这种割裂导致传统机器人受限于'单一指令对应单一动作'的线性束缚,难以适应真实世界的复杂性和不确定性。具身 Agentic OS 的核心目标就是弥合这条鸿沟,构建一个完整的'神经系统',实现真正的'知行合一'。
为了实现这个目标,具身 Agentic OS 采用了自底向上的三层精密结构:
底层:小脑基础模型(Whole-Body Control Foundation Model) 这是'小脑'的核心,也是所有智能的基石。一个高鲁棒性的全身运动控制系统为机器人提供稳定、可靠的原子动作,确保机器人能实时做出任意全身动作,而不是依赖预先训练的单个动作。行走、平衡、抗扰……这一层确保了机器人'行得稳、动得准',保证了上层决策不会因为一个简单的物理动作失败而全盘崩溃。
中层:大小脑融合的高阶技能层 在原子动作的基础之上,系统构建了一个至关重要的高阶技能层。这一层是连接高阶认知(大脑)与底层运控(小脑)的核心枢纽,关键任务在于打通大模型与全身运控基础模型之间的对齐,从而实现'大小脑'的深度融合。系统将经过大量可靠性训练的动作形成一个模块化、可复用的多元技能工具箱。工具箱中的每一项技能都具备环境感知与适应能力,并支持独立迭代与灵活的组合调用,为实现导航、避障、抓取乃至上下楼梯等复杂行为提供了可靠支持。
上层:赋予机器人灵魂的自主认知与决策 这是'大脑'的体现,是整套系统的灵魂,主要涵盖交互、记忆与思考。通过集成多种基础模型与先进的 Agentic 原生决策机制,具身 Agentic OS 能够对中层的海量技能进行统一的调度、协同与规划,管理所有模型、技能、工具、记忆、存储等,最终实现一个完整的智能闭环。
在实际场景中,这一层能力的体现包括:
- 长程任务拆解: 收到'拿两瓶水到前台'的指令后,Oli 自主将其拆解为找到水箱、取两瓶水、前往前台等步骤。
- 多任务处理与动态优先级排序: 途中遇到同事请求送快递,Oli 立刻进行推理决策,判断新任务的可行性,并重新确定任务优先级,决定先完成紧急的待客任务,再处理快递。这就是'边思考边干活'的核心体现。
- 复杂情境下的自主规划: 发现快递被箱子遮挡,Oli 没有等待指令,而是自主生成'先搬箱子,再取快递'的解决方案并完美执行。
- 主动感知任务: 看到地上的废弃纸杯,Oli 主动生成了'捡起来扔掉'的额外任务。这种主动维护环境的意识,标志着它已具备超越指令本身的目标驱动能力。
三大核心能力,赋能真实世界
传统机器人'能动',大模型加持下开始'能想',但要在物理世界里'边思考边干活'却极其困难。搭载具身 Agentic OS 的机器人之所以能做到,背后是三大核心能力在起作用:
一、基于物理逻辑的高阶认知与推理能力 COSA 的顶层设计让机器人拥有了面向真实世界任务的深度逻辑能力。当接收到自然语言指令时,它并非简单匹配关键词,而是进行深度语义理解与意图识别,自主地将长程任务动态拆解为一系列可执行的子任务。更关键的是,这个过程具备基于价值判断的动态优先级调整能力。例如在家庭场景中,若听到婴儿哭声,它能立刻判断'照顾婴儿'的优先级高于'准备晚餐',从而暂停当前任务;在商用场景中,巡逻机器人侦测到高优先级火警警报时,会果断放弃低优先级的清扫任务。
二、构建世界观的语义记忆与主动感知能力 一个无法记忆和理解世界的机器人,永远只能被动地响应瞬时指令。COSA 通过构建跨时间、跨模态的感知与记忆系统,赋予机器人对物理世界的持续认知能力,使其能够对环境、对象、与人的交互历史进行语义记忆和建模,从而构筑起自己的'世界观'。这意味着机器人不仅记得去过哪,更记得物品的归属、状态和人的习惯。更重要的是,它实现了从'被动接受输入'到'主动感知探索'的转变。当信息不足以决策时,它会主动观察或提问以获取信息。

