目前 llama.cpp 官方提供的 Docker 镜像下载命令如下:
docker pull ghcr.io/ggml-org/llama.cpp:server-cuda-b6222
在国内环境下直接拉取该镜像速度较慢。

建议将镜像源替换为国内镜像源 ghcr.nju.edu.cn 以提升下载速度:
# 官方命令
docker pull ghcr.io/ggml-org/llama.cpp:server-cuda
# 国内源地址命令
docker pull ghcr.nju.edu.cn/ggml-org/llama.cpp:server-cuda

