Ubuntu 下 llama.cpp 编译与性能调优实战

综述由AI生成在 Ubuntu 22.04 LTS 环境下编译和优化 llama.cpp 的步骤。包括安装开发工具、CUDA 环境配置、源码克隆及 CMake 编译参数设置。重点讲解了 CPU 和 GPU 加速的基础配置方法，为开发者提供了一套完整的本地部署方案。

灰度发布发布于 2026/4/6更新于 2026/5/2425 浏览

在开始编译 llama.cpp 之前，我们需要确保系统环境满足基本要求。Ubuntu 22.04 LTS 是最推荐的系统版本，它提供了稳定的软件包支持和良好的兼容性。

首先更新系统并安装必要的开发工具：

sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake git curl libcurl4-openssl-dev

对于希望使用 CUDA 加速的用户，还需要安装 NVIDIA 驱动和 CUDA 工具包：

sudo apt install -y nvidia-driver-535 nvidia-cuda-toolkit

接下来，我们获取 llama.cpp 的源代码并初始化构建目录：

git clone https://github.com/ggerganov/llama.cpp cd llama.cpp mkdir build && cd build

基础编译配置使用 CMake 完成。对于纯 CPU 环境，推荐以下配置：

cmake .. -DLLAMA_CURL=ON -DBUILD_SHARED_LIBS=OFF

提示：-DLLAMA_CURL=ON启用了 HTTP 支持，-DBUILD_SHARED_LIBS=OFF创建静态链接库，便于部署。

编译过程可以使用多线程加速：

cmake --build . --config Release -j $(nproc)

编译完成后，主要生成以下可执行文件：

文件名	功能描述

更多推荐文章