llama.cpp + llama-server 的安装部署验证

飞桨AI Studio星河社区-人工智能学习与实训社区

用的是 魔塔的免费资源 不太稳定

我的Notebook · 魔搭社区

cat /etc/os-release

 Ubuntu 22.04.5 LTS (Jammy Jellyfish) —— 这是一个长期支持(LTS)且完全受支持的现代 Linux 发行版,非常适合部署 llama.cpp + llama-server。Ubuntu 22.04 自带较新的 GCC(11+)、CMake(3.22+)和 Python 3.10+,无需手动升级工具链,部署过程非常顺畅。

一、安装系统依赖
sudo apt update

sudo apt install -y git build-essential cmake libssl-dev

二、克隆并编译 llama.cpp

1. 克隆仓库

git clone https://github.com/ggerganov/llama.cpp

cd llama.cpp

步骤 3:使用 CMake 构建 server

mkdir build

sudo apt install -y ninja-build

cd build

cmake .. -G Ninja

ninja server  报错了

rm -rf build  
重新来
mkdir build && cd build
cmake .. -DCMAKE_BUILD_TYPE=Release -DLLAMA_BUILD_SERVER=ON


make -j $(nproc) llama-server

三、准备 GGUF 模型

下载量化模型(以 Llama-3-8B-Instruct Q4_K_M 为例)
cd /mnt/data/

pip install --upgrade pip

pip install modelscope

modelscope download --model QuantFactory/Llama-3-8B-Instruct-Coder-GGUF Llama-3-8B-Instruct-Coder.Q6_K.gguf --local_dir /mnt/data

modelscope download --model ngxson/Qwen2.5-7B-Instruct-1M-Q4_K_M-GGUF qwen2.5-7b-instruct-1m-q4_k_m.gguf --local_dir /mnt/data

Qwen2.5-7B-Instruct-1M-Q4_K_M-GGUF · 模型库

Llama-3-8B-Instruct-Coder-GGUF · 模型库


# 启动

/mnt/workspace/llama.cpp/build/bin/llama-server -m /mnt/data/Llama-3-8B-Instruct-Coder.Q6_K.gguf --port 8080 --host 0.0.0.0 --ctx-size 2048 --threads 8

# 1. 后台启动

nohup /mnt/workspace/llama.cpp/build/bin/llama-server -m /mnt/data/Llama-3-8B-Instruct-Coder.Q6_K.gguf --port 8080 --host 0.0.0.0 --ctx-size 8192 --threads 8 > /mnt/workspace/llama-server.log 2>&1 &

nohup /mnt/workspace/llama.cpp/build/bin/llama-server -m /mnt/data/qwen2.5-7b-instruct-1m-q4_k_m.gguf --port 8080 --host 0.0.0.0 --ctx-size 8192 --threads 8 > /mnt/workspace/llama-server.log 2>&1 &

# 2. 验证

curl http://localhost:8080/health

# 3. 查日志

tail -f /mnt/workspace/llama-server.log

# 4. 停止

pkill -f llama-server

curl http://localhost:8080/completion \ -H "Content-Type: application/json" \ -d '{ "prompt": "<|start_header_id|>user<|end_header_id|>\n\n你好,请写一首关于春天的诗。<|eot_id|><|start_header_id|>assistant<|end_header_id|>\n\n", "n_predict": 150, "stop": ["<|eot_id|>"] }'

curl http://localhost:8080/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "messages": [{"role": "user", "content": "你好!"}], "temperature": 0.7, "max_tokens": 50 }'

Read more

快速掌握PyMAVLink:无人机通信的Python实战指南

快速掌握PyMAVLink:无人机通信的Python实战指南 【免费下载链接】pymavlinkpython MAVLink interface and utilities 项目地址: https://gitcode.com/gh_mirrors/py/pymavlink 在当今无人机技术飞速发展的时代,PyMAVLink作为Python实现的MAVLink协议库,已经成为连接地面站与飞行器的关键桥梁。这个强大的工具库不仅简化了无人机通信的复杂性,更为开发者提供了完整的解决方案。 从零开始:PyMAVLink架构解析 核心通信层设计 PyMAVLink的核心架构围绕MAVLink协议栈构建,通过mavutil.py模块实现了与无人机的高效通信。该模块提供了多种连接方式,包括串口、TCP/UDP网络连接等,确保开发者能够灵活应对不同的应用场景。 协议版本支持:项目支持完整的MAVLink协议版本演进,从v0.9到v2.0,每个版本都有对应的dialects目录实现。这种分层架构确保了向后兼容性和协议扩展性。 多语言代码生成引擎 generator/mavgen.py是整

本地部署智能家居集成解决方案 ESPHome 并实现外部访问( Linux 版本)

本地部署智能家居集成解决方案 ESPHome 并实现外部访问( Linux 版本)

ESPHome 是一款用于 ESP8266 和 ESP32 芯片设备的开源系统,它允许用户通过定义简单的 YAML 配置文件来创建复杂的物联网( IoT )设备应用,而无需直接编写底层代码,特别适合于智能家居解决方案,可以与 Home Assistant 完美集成,但也可以独立使用。本文将详细介绍如何在 Linux 系统局域网内部署 ESPHome 并结合路由侠实现外网访问局域网内部署的 ESPHome 。 第一步,本地部署 ESPHome 1,本教程使用 Linux Ubuntu 系统进行演示,首先输入以下命令更新软件包列表并安装一些必要的依赖项。 sudo apt-get update && sudo apt-get install -y python3-pip python3-dev git 2,安装虚拟环境 venv 模块。 sudo

基于ROS的视觉导航系统实战:黑线循迹+激光笔跟随双模态实现(冰达机器人Nano改造)

基于ROS的视觉导航系统实战:黑线循迹+激光笔跟随双模态实现(冰达机器人Nano改造)

本篇内容是对另一篇文章《双轮智能平衡车基于图像识别技术探究道路自动驾驶理论模型与应用》的补充,有兴趣的同学可以先去那篇文章补一下课,再来看本篇文章效果更佳哦!!! 同时本次分享内容资源均同步上传至github与ZEEKLOG,想要深入学习的同学可以去下载学习!! (资源名称:基于ROS的视觉导航系统实战) 话不多说让我们进入正题吧!         在机器人室内导航场景中,视觉导航凭借低成本、高灵活性的优势成为教育机器人与服务机器人的主流方案。本文基于冰达机器人Nano系列进行硬件改造与软件开发,搭建了一套基于ROS的轻量级视觉导航系统,实现黑线循迹与红外激光笔动态跟随双模态功能。系统兼容ROS Melodic/Noetic版本,针对冰达机器人Nano的算力与底盘特性进行深度优化,低算力依赖、实时性强,非常适合入门级机器人开发者学习与二次拓展。本文将从项目设计、硬件改造、环境配置、代码实现、运行调试到扩展方向进行全流程精细讲解,并附上完整可运行代码与问题排查指南。 目录 1. 项目概述与核心亮点 2. 硬件配置与冰达机器人Nano改造方案 3. 软件环境配置(含版本适

无人机目标检测数据集介绍-14,751张图片 无人机检测 航拍图像

无人机目标检测数据集介绍-14,751张图片 无人机检测 航拍图像

🚁 无人机目标检测数据集介绍-14,751张图片 * 📦 已发布目标检测数据集合集(持续更新) * 🚁 无人机实例目标检测数据集介绍 * 📌 数据集概览 * 包含类别 * 🎯 应用场景 * 🖼 数据特性 * 🌟 项目功能 * 🔗 技术标签 * YOLOv8 训练实战 * 📦 1. 环境配置 * 安装 YOLOv8 官方库 ultralytics * 📁 2. 数据准备 * 2.1 数据标注格式(YOLO) * 2.2 文件结构示例 * 2.3 创建 data.yaml 配置文件 * 🚀 3. 模型训练 * 关键参数补充说明: * 📈 4. 模型验证与测试 * 4.1 验证模型性能 * 关键参数详解 * 常用可选参数 * 典型输出指标 * 4.2 推理测试图像 * 🧠 5. 自定义推理脚本(