Qwen3-VL-32B 多卡部署实战:vLLM 通信瓶颈与 llama.cpp 优化方案 | 极客日志