玩客云边缘 AI 模型本地部署：llama.cpp 与 Qwen | 极客日志

C++AI算法

玩客云边缘 AI 模型本地部署：llama.cpp 与 Qwen

玩客云边缘 AI 模型本地部署方案。涵盖环境准备、llama.cpp 编译、模型下载、CLI 推理及服务端启动。支持 ARM 架构，提供脚本自动化下载与运行，集成 Open WebUI 扩展功能。

岁月神偷发布于 2026/4/8更新于 2026/5/2422 浏览

安装基础依赖

打开终端，输入以下命令更新系统并安装编译工具：

sudo apt update && sudo apt upgrade -y
sudo apt install git build-essential cmake python3 python3-pip -y

安装系统包版本 numpy：

sudo apt update
sudo apt install python3-numpy -y

这一步保证你可以编译 llama.cpp 和运行 Python 脚本。

下载并编译 llama.cpp

使用一键构建脚本 install_llama.sh：

#!/bin/bash
set -e
# 有错误直接退出，别默默翻车
REPO_URL="https://github.com/ggerganov/llama.cpp"
DIR_NAME="llama.cpp"
BUILD_DIR="build"
echo "== llama.cpp 一键构建脚本 =="
# 1. 检查源码是否存在
if [ ! -d "$DIR_NAME" ]; then
    echo "[INFO] 未检测到 llama.cpp，开始下载..."
    export http_proxy=http://192.168.1.131:7897
    export https_proxy=http://192.168.1.131:7897
    git clone "$REPO_URL"
    echo "[OK] 下载完成"
else
    echo "[OK] 已存在 llama.cpp，跳过下载"
fi
cd "$DIR_NAME"
# 2. 检查 build 目录
if [ ! -d "$BUILD_DIR" ]; then
     
     

     

 

 
cmake -DCMAKE_BUILD_TYPE=Release ..
 
make -j1

相关免费在线工具

加密/解密文本
使用加密算法（如AES、TripleDES、Rabbit或RC4）加密和解密文本明文。在线工具，加密/解密文本在线工具，online
RSA密钥对生成器
生成新的随机RSA私钥和公钥pem证书。在线工具，RSA密钥对生成器在线工具，online
Mermaid 预览与可视化编辑
基于 Mermaid.js 实时预览流程图、时序图等图表，支持源码编辑与即时渲染。在线工具，Mermaid 预览与可视化编辑在线工具，online
随机西班牙地址生成器
随机生成西班牙地址（支持马德里、加泰罗尼亚、安达卢西亚、瓦伦西亚筛选），支持数量快捷选择、显示全部与下载。在线工具，随机西班牙地址生成器在线工具，online
Gemini 图片去水印
基于开源反向 Alpha 混合算法去除 Gemini/Nano Banana 图片水印，支持批量处理与下载。在线工具，Gemini 图片去水印在线工具，online
Base64 字符串编码/解码
将字符串编码和解码为其 Base64 格式表示形式即可。在线工具，Base64 字符串编码/解码在线工具，online

cd ~/llama.cpp/build/bin
./test-backend-ops

export http_proxy=http://192.168.1.131:7897
export https_proxy=http://192.168.1.131:7897

cd ~
mkdir models
cd /root/models

wget --no-check-certificate --secure-protocol=TLSv1_2 https://huggingface.co/Qwen/Qwen2.5-Coder-0.5B-Instruct-GGUF/resolve/main/qwen2.5-coder-0.5b-instruct-q5_0.gguf

scp qwen2.5-coder-0.5b-instruct-q5_0.gguf [email protected]:/root/models

#!/bin/bash
# 使用方法：./dl.sh <下载链接> [保存文件名]
# 示例：./dl.sh https://huggingface.co/Qwen/Qwen2.5-Coder-0.5B-Instruct-GGUF/resolve/main/qwen2.5-coder-0.5b-instruct-q5_0.gguf
# 设置代理
export http_proxy=http://192.168.1.131:7897
export https_proxy=http://192.168.1.131:7897
URL="$1"
FILENAME="$2"
if [ -z "$URL" ]; then
    echo "请提供下载链接"
    exit 1
fi
# 如果没有指定文件名，自动从 URL 提取
if [ -z "$FILENAME" ]; then
    FILENAME=$(basename "$URL")
fi
echo "开始下载：$URL"
echo "保存为：$FILENAME"
wget --no-check-certificate --secure-protocol=TLSv1_2 -c "$URL" -O "$FILENAME" --tries=5 --timeout=30
if [ $? -eq 0 ]; then
    echo "下载完成：$FILENAME"
else
    echo "下载失败，请检查网络或代理设置"
fi

./llama.cpp/build/bin/llama-cli -m /root/models/qwen2.5-coder-0.5b-instruct-q5_0.gguf -p "hello" -n 500

#!/bin/bash
MODEL_FILE=${1:-"qwen2.5-coder-0.5b-instruct-q5_0.gguf"}
MODEL_PATH="$HOME/models/$MODEL_FILE"
if [ ! -f "$MODEL_PATH" ]; then
    echo "错误：模型文件 $MODEL_PATH 不存在！"
    exit 1
fi
CTX_SIZE=1024
N_PREDICT=512
TEMP=0.3
THREADS=4
echo "开始加载模型：$MODEL_FILE"
echo "参数：上下文=$CTX_SIZE，生成 token 数=$N_PREDICT，温度=$TEMP，线程数=$THREADS"
"$HOME/llama.cpp/build/bin/llama-cli" \
-m "$MODEL_PATH" \
-c $CTX_SIZE \
-n $N_PREDICT \
--temp $TEMP \
--threads $THREADS \
--color auto

docker run -d \
--name open-webui \
-p 3000:8080 \
-e OPENAI_API_BASE_URL=http://192.168.1.191:8080/v1 \
-e OPENAI_API_KEY=sk-local \
--restart unless-stopped \
ghcr.io/open-webui/open-webui:main

/root/llama.cpp/build/bin/llama-server \
-m /root/models/qwen2.5-coder-0.5b-instruct-q8_0.gguf \
-c 2048 \
--host 0.0.0.0 \
--port 8080

curl http://127.0.0.1:8080/v1/models

{
  "models": [
    {
      "name": "qwen2.5-coder-0.5b-instruct-q8_0.gguf",
      "model": "qwen2.5-coder-0.5b-instruct-q8_0.gguf",
      "type": "model",
      "capabilities": ["completion"]
    }
  ],
  "object": "list",
  "data": [
    {
      "id": "qwen2.5-coder-0.5b-instruct-q8_0.gguf",
      "object": "model",
      "created": 1769056357,
      "owned_by": "llamacpp",
      "meta": {
        "vocab_type": 2,
        "n_vocab": 151936,
        "n_ctx_train": 32768,
        "n_embd": 896,
        "n_params": 630167424,
        "size": 669763072
      }
    }
  ]
}

玩客云边缘 AI 模型本地部署：llama.cpp 与 Qwen

安装基础依赖

下载并编译 llama.cpp

更多推荐文章

相关免费在线工具

下载模型

一键下载脚本 dl.sh

运行

一键启动脚本 start.sh

扩展

更多推荐文章

相关免费在线工具

玩客云边缘 AI 模型本地部署：llama.cpp 与 Qwen

安装基础依赖

下载并编译 llama.cpp

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具

下载模型

一键下载脚本 dl.sh

运行

一键启动脚本 start.sh

扩展

微信扫一扫，关注极客日志

更多推荐文章

相关免费在线工具