Qwen2.5-72B-GPTQ-Int4 实战:vLLM 推理与 Chainlit 可视化集成 | 极客日志