大模型高效部署方法对比:以 LLaMA2 为例 | 极客日志