从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

优质文章学习记录

08 Apr 2026 — 2 min read

从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

在人工智能技术快速发展的今天，大型语言模型(LLM)已成为开发者工具箱中不可或缺的一部分。而llama.cpp作为一款高效、轻量级的LLM推理框架，因其出色的性能和跨平台支持，越来越受到开发者的青睐。本文将带您深入探索在Ubuntu环境下编译和优化llama.cpp的全过程，从基础环境搭建到高级性能调优，为您呈现一套完整的解决方案。

1. 环境准备与基础编译

在开始编译llama.cpp之前，我们需要确保系统环境满足基本要求。Ubuntu 22.04 LTS是最推荐的系统版本，它提供了稳定的软件包支持和良好的兼容性。

首先更新系统并安装必要的开发工具：

sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake git curl libcurl4-openssl-dev

对于希望使用CUDA加速的用户，还需要安装NVIDIA驱动和CUDA工具包：

sudo apt install -y nvidia-driver-535 nvidia-cuda-toolkit

接下来，我们获取llama.cpp的源代码并初始化构建目录：

git clone https://github.com/ggerganov/llama.cpp cd llama.cpp mkdir build && cd build

基础编译配置使用CMake完成。对于纯CPU环境，推荐以下配置：

cmake .. -DLLAMA_CURL=ON -DBUILD_SHARED_LIBS=OFF

提示：-DLLAMA_CURL=ON启用了HTTP支持，-DBUILD_SHARED_LIBS=OFF创建静态链接库，便于部署。

编译过程可以使用多线程加速：

cmake --build . --config Release -j $(nproc)

编译完成后，主要生成以下可执行文件：

文件名	功能描述

Read more

基于FPGA的QAM调制解调技术深度解析与实验指南

基于FPGA的QAM调制解调技术深度解析与实验指南

基于FPGA的QAM调制解调，有详细实验文档一、系统概述本系统基于FPGA实现16QAM（正交振幅调制）完整的调制解调功能，采用Altera Cyclone IV GX系列FPGA芯片（型号EP4CGX75CF23C8），开发工具为Quartus II 11.0。系统可生成多种基带信号，经16QAM调制后输出至DAC（数模转换器），同时能接收外部信号并完成解调，还原出原始基带信号，支持上位机通过IIC接口配置参数与选择波形显示，适用于通信领域的信号传输与验证场景。基于FPGA的QAM调制解调，有详细实验文档系统整体架构分为信号源模块、16QAM调制模块、载波处理模块、16QAM解调模块、数据输出与控制模块五大核心部分，各模块间通过时钟同步与数据握手信号协同工作，确保信号处理的实时性与准确性。二、核心模块功能说明（一）信号源模块：生成高质量基带信号信号源模块是整个系统的信号输入源头，负责产生符合16QAM调制要求的基带信号，支持多种信号类型与参数配置，满足不同测试场景需求。 1. 核心功能 * 多类型信号生成：可生成伪随机码（PN8序列）、固定长度码

第五节.Stable Diffusion大模型

第五节.Stable Diffusion大模型

🍉大模型（Stable Diffusion 模型）大模型，也叫 Stable Diffusion 模型，是 Stable Diffusion 绘图的核心基础，所有生成效果都依赖它。常见版本大模型已迭代出多个版本，常见的有： * Stable Diffusion 1.4（SD1.4） * Stable Diffusion 1.5（SD1.5） * Stable Diffusion 2.0（SD2.0） * Stable Diffusion 2.1（SD2.1） * Stable Diffusion XL（SDXL） * Playground、Stable Cascade 等对初学者来说，

我是搞量化AI的，但我为什么劝你一定要关掉“自动交易机器人”？

我是搞量化AI的，但我为什么劝你一定要关掉“自动交易机器人”？

作者：老余捞鱼原创不易，转载请标明出处及原作者。写在前面的话：很多市面上充斥着“睡后收入”、“AI自动炒股”的广告，听着很诱人吧？但作为一个在量化圈摸爬滚打多年的人，我要告诉你一个反常识的真相：这些机器人不仅不能帮你赚钱，反而是你亏损的罪魁祸首。今天不聊代码，聊聊为什么在AI时代，你的人脑依然不可替代。最近朋友圈全是卖“AI炒股机器人”的广告：号称年化100%，解放双手，让你躺着把钱赚了。看得我尴尬症都犯了。作为一个靠写代码和算法吃饭的人，我今天必须说句得罪同行的话：对于99%的普通投资者来说，全自动交易机器人（Trading Bots）就是一条通往破产的高速公路。这就好比你还没学会开车，就买了一辆号称能“全自动驾驶”但实际上连红绿灯都分不清的汽车，然后就在高速上睡着了。真正的交易不是代码的堆砌，而是对市场的洞察 01 机器人的死穴：它看不懂“空气” 你有没有过这种经历：走进一个房间，大家虽然没说话，但你立刻感觉到气氛不对：可能刚吵完架，可能有人在哭。这就是“

【论文笔记】Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval

论文信息论文标题： Scalable Defense against In-the-wild Jailbreaking Attacks with Safety Context Retrieval - ICML 2025 论文作者： Taiye Chen , Zeming Wei , Ang Li , Yisen Wang - PKU 论文链接：http://arxiv.org/abs/2505.15753 关键词： LLM Safety, Jailbreaking, RAG 研究背景尽管大语言模型（LLMs）经过了人类反馈强化学习（RLHF）等安全对齐技术处理，但仍易受到“越狱攻击”（Jailbreaking Attacks）的威胁，即通过精心设计的提示词诱导模型产生有害输出。