OpenPI π0 源码深度剖析：从模型架构、扩散策略到 C/S 部署实战

前言

随着具身智能与大模型技术的融合，π0（OpenPI）作为一套基于 PaLI-Gemma 和扩散策略的通用机器人控制框架，受到了广泛关注。本文旨在深入剖析其开源源码结构，帮助开发者理解从模型架构设计、训练流程到实际部署的全链路实现。

第一部分 π0 模型架构的实现：src 下 models 的全面分析与解读

核心代码位于 src/openpi/models 目录下，主要包含基础模型定义、Pi0 扩散模型实现、语言与视觉组件以及 Tokenizer。

1.1 models/model.py：核心基础模型的定义

这是模型框架的核心文件，定义了基础的抽象类和数据结构。

BaseModelConfig: 所有模型配置的抽象基类。
BaseModel: 所有模型实现的抽象基类。
Observation: 保存模型输入的数据类。
Actions: 定义动作数据格式。

1.1.1 基础组件和关键常量

模型类型枚举定义了两种支持的模型类型：

class ModelType(enum.Enum):
    """Supported model types."""
    PI0 = "pi0"
    PI0_FAST = "pi0_fast"

图像输入配置定义了模型期望接收三个视角的图像：基础视图、左手腕视图和右手腕视图。

# The model always expects these images
IMAGE_KEYS = (
    "base_0_rgb",
    "left_wrist_0_rgb",
    "right_wrist_0_rgb",
)

图像分辨率通常设置为 224×224 像素。

1.1.2 Observation 类与 Actions 类型的详解

Observation 类是 OpenPI 框架中的核心数据结构，用于存储和管理模型的输入数据。它包含了机器人感知系统收集的所有必要信息，如低维度的机器人状态、图像掩码及图像数据等。

class Observation(Generic[ArrayT]):
    """Holds observations, i.e., inputs to the model."""
    # Images, in [-1, 1] float32.
    images: dict[str, at.Float[ArrayT, "*b h w c"]]
    image_masks: dict[str, at.Bool[ArrayT, "*b"]]
    state: at.Float[ArrayT, "*b s"]
    tokenized_prompt: at.Int[ArrayT, "*b l"] |  =

OpenPI π0 源码深度剖析：从模型架构、扩散策略到 C/S 部署实战

前言

第一部分 π0 模型架构的实现：src 下 models 的全面分析与解读

1.1 models/model.py：核心基础模型的定义

1.1.1 基础组件和关键常量

1.1.2 Observation 类与 Actions 类型的详解

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

1.2 models/pi0.py 的实现

1.2.1 make_attn_mask：注意力掩码生成函数

1.2.2 posemb_sincos：位置编码函数

1.2.3 class Pi0Config

1.2.3.1 inputs_spec：定义了 π0 模型本身接收的输入数据格式

1.2.3.2 get_freeze_filter：参数冻结器

1.2.4 class Pi0：含特征嵌入、损失函数、推理

1.2.4.1 初始化方法 init

1.2.4.2 特征嵌入方法：embed_prefix/embed_suffix

1.2.4.3 损失函数 compute_loss

1.2.4.4 推理函数 sample_actions

1.3 语言模型实现：models/gemma.py

1.4 视觉模型实现：models/siglip.py

1.5 tokenizer.py

1.5.1 PaligemmaTokenizer 类

1.5.2 FASTTokenizer 类

1.6 lora.py

1.7 vit.py

第二部分 策略适配接口：src 下 policy 的全面分析与解读

2.1 policy.py

2.1.1 Policy 类

2.1.2 PolicyRecorder

2.2 policy_config.py

2.3 policies/aloha_policy.py

第三部分 模型训练的配置：src 下 training 模块的全面分析与解读

3.1 配置系统 (config.py)

3.2 数据加载系统 data_loader.py

3.2.2 create_dataset

3.2.3 transform_dataset

3.3 优化器系统 (optimizer.py)

3.4 检查点系统 (checkpoints.py)

3.5 模型分片系统 (sharding.py)

3.6 权重加载系统 (weight_loaders.py)

3.7 辅助工具 (utils.py)

第四部分 模型的训练与部署：基于客户端 - 服务器 C/S 架构

4.1 packages/openpi-client

4.2 scripts(策略服务器)

4.2.3 serve_policy.py

4.2.5 train.py

第五部分 examples：各种机器人平台及策略客户端的示例实现

5.1 aloha_real

5.1.1 核心架构

5.1.2 系统工作流程与部署方式

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

第二部分策略适配接口：src 下 policy 的全面分析与解读

第三部分模型训练的配置：src 下 training 模块的全面分析与解读

第四部分模型的训练与部署：基于客户端 - 服务器 C/S 架构