部署 Qwen2.5-VL-32B 踩坑实录:多卡推理 vLLM 死锁与 llama.cpp 对比 | 极客日志