Qwen3-VL-32B 多卡部署:vLLM 通信瓶颈与 llama.cpp 实践对比 | 极客日志