Llama-2-7b 模型在昇腾 NPU 上的性能测评与部署优化 | 极客日志