RoboBrain 2.0 具身大脑模型
RoboBrain 2.0 是一个机器人的具身大脑模型,具备统一感知、推理和规划能力;同时适应对物理环境中复杂的具身任务。
它提供不同版本:轻量级的 3B、7B 模型和全尺寸的 32B 模型,包含视觉编码器和语言模型。
快速了解模型
RoboBrain 2.0支持交互式推理,包括长远规划和闭环反馈、从复杂指令中精确预测点和边界框的空间感知、用于估计未来轨迹的时间感知***,以及通过实时结构化记忆构建和更新进行场景推理。

模型架构

1、创建 Conda 环境
首先创建一个 Conda 环境,名字为 robobrain2,python 版本为 3.10;然后进入 robobrain2 环境。
conda create -n robobrain2 python=3.10
conda activate robobrain2
下载 robobrain2 代码到本地:
git clone https://github.com/FlagOpen/RoboBrain2.0.git
cd RoboBrain2.0
2、安装依赖库
编辑 requirements.txt 文件,内容如下所示:
# pip install -r requirements.txt # 深度学习框架 & 训练/推理加速
pytorch-lightning==1.9.5
transformers==4.50.0
tokenizers==0.21.0
huggingface-hub==0.27.1
safetensors==0.5.2
accelerate==1.3.0
deespeed==0.15.0
peft==0.14.0
trl==0.9.6
flash-attn==2.5.9.post1
xformers==0.0.28.post3
triton==3.1.0
vllm==0.7.3
tensor-parallel==1.2.4
fairscale==0.4.13
diffusers==0.29.2
bitsandbytes==0.43.3
gguf==0.10.0
# 科学计算 & 数值 / 图像 / 信号
numpy==1.26.4
scipy==1.15.1
scikit-learn==1.6.1
scikit-image==0.20.0
pandas==2.2.3
matplotlib==3.7.5
seaborn==0.13.2
Pillow==11.1.0
opencv-python==4.7.0.72
opencv-python-headless==4.11.0.86
av==14.4.0
imageio-ffmpeg==0.5.1
PyWavelets==1.4.1
numba==0.60.0
einops==0.8.0
einx==0.3.0
ml_dtypes==0.5.3
cupy-cuda12x==13.4.1
# 数据 & 特征 / 向量 / 文本
datasets==3.6.0
evaluate==0.4.2
sentence-transformers==3.4.1
FlagEmbedding==1.3.4
openai==1.60.0
tiktoken==0.7.0
sentencepiece==0.2.0
regex==2024.11.6
ftfy==6.2.0
chattts==0.2.1
qwen-vl-utils==0.0.8
# 分布式 / 并行 / 集群
ray==2.40.0
dask==2023.4.1
torch-ort==1.17.0
msccl==2.3.0
# Web 服务 & API 框架
fastapi==0.115.6
uvicorn==0.34.0
starlette==0.41.3
gradio==5.12.0
gradio_client==1.5.4
httpx==0.27.2
requests==2.32.3
pydantic==2.10.5
pydantic-settings==2.7.1
typer==0.15.1
# 异步 / 并发 / 网络
aiohttp==3.11.11
anyio==4.8.0
websockets==14.1
tornado==6.4.1
async-timeout==4.0.3
# 配置 / 日志 / 进度 / 序列化
omegaconf==2.3.0
tqdm
PyYAML
orjson==3.10.14
msgpack==1.1.0
lz4==4.4.4
xxhash==3.5.0
# 其他常用工具
typing_extensions==4.12.2
packaging==24.2
filelock==3.16.1
psutil==7.0.0










