基于 AirLLM 实现 4GB 显存环境下的 Qwen2.5-72B 本地推理 | 极客日志