多卡部署 Qwen3-VL-32B:vLLM 通信瓶颈与 llama.cpp 实践 | 极客日志