llama-cpp-python Windows 本地大模型部署指南
环境准备:告别复杂配置
系统要求检查
在开始之前,请确保你的系统满足以下基本要求:
- Windows 10 或更高版本
- Python 3.8 及以上
- 至少 4GB 可用内存
- 支持 AVX 指令集的 CPU
Python 环境快速搭建
打开命令提示符,执行以下步骤:
# 创建专用虚拟环境
python -m venv llama-env
# 激活环境
llama-env\Scripts\activate
# 更新包管理工具
python -m pip install --upgrade pip
一键安装:三种方案任选
方案一:预编译版本(推荐新手)
这是最简单的安装方式,无需编译,直接使用:
pip install llama-cpp-python --extra-index-url https://abetlen.github.io/llama-cpp-python/whl/cpu
方案二:标准安装
如果你希望获得最新功能,可以使用标准安装:
pip install llama-cpp-python
方案三:完整功能版
需要服务器功能时,安装完整版本:
pip install "llama-cpp-python[server]"
模型获取:开启 AI 之旅
下载预训练模型
项目支持多种模型格式,推荐使用 GGUF 格式:
# 创建模型存储目录
mkdir models
cd models
# 下载示例模型(以 Qwen2 为例)
# 注意:实际使用时请根据需求选择合适的模型
快速验证:你的第一个 AI 应用
基础文本生成测试
创建一个简单的测试脚本 test_ai.py:
from llama_cpp import Llama
# 初始化模型
llm = Llama(
model_path="./models/your-model.gguf",
n_ctx=2048
)
# 生成文本
response = llm.create_completion(
prompt="请用一句话介绍人工智能:",
max_tokens=50
)
print(response[][][])

