大模型时代人形机器人感知:视觉 - 语言模型应用 | 极客日志