基于 Docker 和 Ray 的 vLLM 分布式推理部署:Qwen3-4B 在双 3090 环境 | 极客日志