RoboBrain 2.0 具身大脑模型
RoboBrain 2.0 是一个机器人的具身大脑模型,具备统一感知、推理和规划能力;同时适应对物理环境中复杂的具身任务。
它提供不同版本:轻量级的 3B、7B 模型和全尺寸的 32B 模型,包含视觉编码器和语言模型。
代码地址:https://github.com/FlagOpen/RoboBrain2.0
论文地址:RoboBrain 2.0 Technical Report
快速了解模型
RoboBrain 2.0支持交互式推理,包括长远规划和闭环反馈、从复杂指令中精确预测点和边界框的空间感知、用于估计未来轨迹的时间感知,以及通过实时结构化记忆构建和更新进行场景推理。

模型架构:

1、创建 Conda 环境
首先创建一个 Conda 环境,名字为 robobrain2,python 版本为 3.10;然后进入 robobrain2 环境,执行下面命令:
conda create -n robobrain2 python=3.10 conda activate robobrain2
下载 robobrain2 代码到本地:
git clone https://github.com/FlagOpen/RoboBrain2.0.git
cd RoboBrain2.0
2、安装依赖库
编辑 requirements.txt 文件,内容如下所示:
# pip install -r requirements.txt # 深度学习框架 & 训练/推理加速 pytorch-lightning==1.9.5 transformers==4.50.0 tokenizers==0.21.0 huggingface-hub==0.27.1 safetensors==0.5.2 accelerate==1.3.0 deepspeed==0.15.0 peft==0.14.0 trl==0.9.6 flash-attn==2.5.9.post1 xformers==0.0.28.post3 triton==3.1.0 vllm==0.7.3 tensor-parallel==1.2.4 fairscale==0.4.13 diffusers==0.29.2 bitsandbytes==0.43.3 gguf==0.10.0 # 科学计算 & 数值 / 图像 / 信号 numpy==1.26.4 scipy==1.15.1 scikit-learn==1.6.1 scikit-image==0.20.0 pandas==2.2.3 matplotlib==3.7.5 seaborn==0.13.2 Pillow==11.1.0 opencv-python==4.7.0.72 opencv-python-headless==4.11.0.86 av==14.4.0 imageio-ffmpeg==0.5.1 PyWavelets==1.4.1 numba==0.60.0 einops==0.8.0 einx==0.3.0 ml_dtypes==0.5.3 cupy-cuda12x==13.4.1 # 数据 & 特征 / 向量 / 文本 datasets==3.6.0 evaluate==0.4.2 sentence-transformers==3.4.1 FlagEmbedding==1.3.4 openai==1.60.0 tiktoken==0.7.0 sentencepiece==0.2.0 regex==2024.11.6 ftfy==6.2.0 chattts==0.2.1 qwen-vl-utils==0.0.8 # 分布式 / 并行 / 集群 ray==2.40.0 dask==2023.4.1 torch-ort==1.17.0 msccl==2.3.0 # Web 服务 & API 框架 fastapi==0.115.6 uvicorn==0.34.0 starlette==0.41.3 gradio==5.12.0 gradio_client==1.5.4 httpx==0.27.2 requests==2.32.3 pydantic==2.10.5 pydantic-settings==2.7.1 typer==0.15.1 # 异步 / 并发 / 网络 aiohttp==3.11.11 anyio==4.8.0 websockets==14.4 tornado==6.4.1 async-timeout==4.0.3 # 配置 / 日志 / 进度 / 序列化 omegaconf==2.3.0 tqdm PyYAML orjson==3.10.14 msgpack==1.1.0 lz4==4.4.4 xxhash==3.5.0 # 其他常用工具 typing_extensions==4.12.2 packaging==24.2 filelock==3.16.1 psutil==7.0.0










