llama-cpp-python 完整安装与配置指南

基础安装：一键搞定

llama-cpp-python 的安装过程极其简单，只需运行以下命令：

pip install llama-cpp-python

这个命令会自动从源码构建 llama.cpp，并将其与 Python 包一起安装。如果遇到构建问题，可以添加 --verbose 参数查看详细构建日志。

硬件加速配置方案

为了获得最佳性能表现，您可以根据自己的硬件配置选择合适的加速后端。

CUDA 加速配置（NVIDIA 显卡用户）

CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python

Metal 加速配置（苹果设备用户）

CMAKE_ARGS="-DGGML_METAL=on" pip install llama-cpp-python

OpenBLAS 加速配置（CPU 优化方案）

CMAKE_ARGS="-DGGML_BLAS=ON -DGGML_BLAS_VENDOR=OpenBLAS" pip install llama-cpp-python

预构建轮子安装方法

如果您不想从源码编译，可以使用预构建的二进制轮子进行快速安装。

基础 CPU 版本

pip install llama-cpp-python --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cpu

CUDA 加速版本

pip install llama-cpp-python --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cu121

快速验证安装结果

安装完成后，您可以通过创建一个简单的测试脚本来验证安装是否成功：

from llama_cpp import Llama
# 初始化模型（请替换为实际模型路径）
llm = Llama(model_path="./models/your-model.gguf")
# 进行简单的文本生成测试
output = llm("你好，请介绍一下你自己", max_tokens=32)
print(output)

常见安装问题解决方案

Windows 系统安装问题

如果在 Windows 系统上遇到'找不到 nmake'或 CMAKE_C_COMPILER 相关错误，可以设置以下环境变量：

$env:CMAKE_GENERATOR = "MinGW Makefiles"
$env:CMAKE_ARGS = "-DGGML_OPENBLAS=on -DCMAKE_C_COMPILER=C:/w64devkit/bin/gcc.exe"

基础安装：一键搞定

llama-cpp-python 的安装过程极其简单，只需运行以下命令：

pip install llama-cpp-python

这个命令会自动从源码构建 llama.cpp，并将其与 Python 包一起安装。如果遇到构建问题，可以添加 --verbose 参数查看详细构建日志。

硬件加速配置方案

为了获得最佳性能表现，您可以根据自己的硬件配置选择合适的加速后端。

CUDA 加速配置（NVIDIA 显卡用户）

CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python

Metal 加速配置（苹果设备用户）

CMAKE_ARGS="-DGGML_METAL=on" pip install llama-cpp-python

OpenBLAS 加速配置（CPU 优化方案）

CMAKE_ARGS="-DGGML_BLAS=ON -DGGML_BLAS_VENDOR=OpenBLAS" pip install llama-cpp-python

预构建轮子安装方法

如果您不想从源码编译，可以使用预构建的二进制轮子进行快速安装。

基础 CPU 版本

pip install llama-cpp-python --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cpu

CUDA 加速版本

pip install llama-cpp-python --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cu121

快速验证安装结果

安装完成后，您可以通过创建一个简单的测试脚本来验证安装是否成功：

from llama_cpp import Llama
# 初始化模型（请替换为实际模型路径）
llm = Llama(model_path="./models/your-model.gguf")
# 进行简单的文本生成测试
output = llm("你好，请介绍一下你自己", max_tokens=32)
print(output)

常见安装问题解决方案

Windows 系统安装问题

如果在 Windows 系统上遇到'找不到 nmake'或 CMAKE_C_COMPILER 相关错误，可以设置以下环境变量：

$env:CMAKE_GENERATOR = "MinGW Makefiles"
$env:CMAKE_ARGS = "-DGGML_OPENBLAS=on -DCMAKE_C_COMPILER=C:/w64devkit/bin/gcc.exe"

llama-cpp-python 完整安装与配置指南

基础安装：一键搞定

硬件加速配置方案

CUDA 加速配置（NVIDIA 显卡用户）

Metal 加速配置（苹果设备用户）

OpenBLAS 加速配置（CPU 优化方案）

预构建轮子安装方法

基础 CPU 版本

CUDA 加速版本

快速验证安装结果

常见安装问题解决方案

Windows 系统安装问题

llama-cpp-python 完整安装与配置指南

基础安装：一键搞定

硬件加速配置方案

CUDA 加速配置（NVIDIA 显卡用户）

Metal 加速配置（苹果设备用户）

OpenBLAS 加速配置（CPU 优化方案）

预构建轮子安装方法

基础 CPU 版本

CUDA 加速版本

快速验证安装结果

常见安装问题解决方案

Windows 系统安装问题

更多推荐文章

相关免费在线工具

MacOS 系统注意事项

开发环境搭建指南

核心功能模块介绍

高级 API 使用示例

聊天完成功能

更多推荐文章

相关免费在线工具

llama-cpp-python 完整安装与配置指南

基础安装：一键搞定

硬件加速配置方案

CUDA 加速配置（NVIDIA 显卡用户）

Metal 加速配置（苹果设备用户）

OpenBLAS 加速配置（CPU 优化方案）

预构建轮子安装方法

基础 CPU 版本

CUDA 加速版本

快速验证安装结果

常见安装问题解决方案

Windows 系统安装问题

llama-cpp-python 完整安装与配置指南

基础安装：一键搞定

硬件加速配置方案

CUDA 加速配置（NVIDIA 显卡用户）

Metal 加速配置（苹果设备用户）

OpenBLAS 加速配置（CPU 优化方案）

预构建轮子安装方法

基础 CPU 版本

CUDA 加速版本

快速验证安装结果

常见安装问题解决方案

Windows 系统安装问题

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

MacOS 系统注意事项

开发环境搭建指南

核心功能模块介绍

高级 API 使用示例

聊天完成功能

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具