从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

优质文章学习记录

11 Apr 2026 — 2 min read

从零到一：Ubuntu上llama.cpp的编译艺术与性能调优实战

在人工智能技术快速发展的今天，大型语言模型(LLM)已成为开发者工具箱中不可或缺的一部分。而llama.cpp作为一款高效、轻量级的LLM推理框架，因其出色的性能和跨平台支持，越来越受到开发者的青睐。本文将带您深入探索在Ubuntu环境下编译和优化llama.cpp的全过程，从基础环境搭建到高级性能调优，为您呈现一套完整的解决方案。

1. 环境准备与基础编译

在开始编译llama.cpp之前，我们需要确保系统环境满足基本要求。Ubuntu 22.04 LTS是最推荐的系统版本，它提供了稳定的软件包支持和良好的兼容性。

首先更新系统并安装必要的开发工具：

sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake git curl libcurl4-openssl-dev

对于希望使用CUDA加速的用户，还需要安装NVIDIA驱动和CUDA工具包：

sudo apt install -y nvidia-driver-535 nvidia-cuda-toolkit

接下来，我们获取llama.cpp的源代码并初始化构建目录：

git clone https://github.com/ggerganov/llama.cpp cd llama.cpp mkdir build && cd build

基础编译配置使用CMake完成。对于纯CPU环境，推荐以下配置：

cmake .. -DLLAMA_CURL=ON -DBUILD_SHARED_LIBS=OFF

提示：-DLLAMA_CURL=ON启用了HTTP支持，-DBUILD_SHARED_LIBS=OFF创建静态链接库，便于部署。

编译过程可以使用多线程加速：

cmake --build . --config Release -j $(nproc)

编译完成后，主要生成以下可执行文件：

文件名	功能描述

Read more

FPGA小白学习日志二：利用LED实现2选1多路选择器

在上一篇文章中，主播利用炒菜的比喻帮大家介绍了LED工程的建立，所以在读这一篇文章前，大家可以简要回顾以下LED工程的建立流程。本篇内容，主播主要向大家介绍数据选择器工程的实现方法。在开始之前，我们先来了解一下数据选择器是什么：所谓数据选择器，就是从多个输入的逻辑信号中选择一个逻辑信号输出，实现数据选择功能的逻辑电路就是数据选择器。我们用来打个比方，现在我们手中有两张电影票A和B,但这时我们是不知道到底哪张电影票是允许我们进入电影院的，这时候我们就要去问检票员，检票员说A，那就可以进；否则，B就可以进。通过这个比喻，我们就能理解数据选择器的大体思路了：这里的电影票A与B就相当于输入信号in1与in2，检票员就相当于数据选择信号sel（英文select），电影院就相当于输出信号out，注意这里的输出信号out只有一个。因此，我们就可以在Visio中设计出2-1数据选择器：同样，我们给出2-1数据选择器的真值表：我们来分析以下这个真值表：当选择信号sel为0时，对应输入信号in

一文讲清楚RAG 四大模式：Naive RAG、Advanced RAG、Modular RAG 与 Agentic RAG

一文讲清楚RAG 四大模式：Naive RAG、Advanced RAG、Modular RAG 与 Agentic RAG

随着技术迭代，RAG 已从最初的简单架构发展出多种进阶形态。本文将系统解析 RAG 的四大主流模式 ——Naive RAG、Advanced RAG、Modular RAG 与 Agentic RAG，从工作原理、技术特点到适用场景进行全方位对比，为技术选型提供参考。一、RAG 基础：检索增强生成的核心逻辑在深入模式解析前，需先明确 RAG 的核心逻辑。简单来说，RAG 由检索（Retrieval）与生成（Generation）两大模块构成：检索模块：从预设知识库中精准定位与用户问题相关的信息片段（如文档、段落、句子）；生成模块：基于检索到的信息，结合大语言模型生成符合上下文、逻辑连贯的答案。这种 “先检索再生成” 的模式，既保留了 LLM 的语言理解与生成能力，又通过外部知识的引入弥补了模型训练数据过时、事实准确性不足的缺陷。

从零开始：Xilinx FPGA实现RISC-V五级流水线CPU手把手教程

从一块FPGA开始，亲手造一颗CPU：RISC-V五级流水线实战全记录你还记得第一次点亮LED时的兴奋吗？那种“我真正控制了硬件”的感觉，让人上瘾。但如果你能自己设计一颗处理器，让它跑起第一条指令——那才是数字世界的终极浪漫。今天，我们就来做这件“疯狂”的事：在一块Xilinx FPGA上，用Verilog从零实现一个完整的RISC-V五级流水线CPU 。不是调用IP核，不是简化版demo，而是包含取指、译码、执行、访存、写回五大阶段，并解决真实数据冒险与控制冒险的可运行核心。这不仅是一次教学实验，更是一场对计算机本质的深度探索。为什么是 RISC-V + FPGA？别误会，我们不是为了赶潮流才选RISC-V。恰恰相反，它是目前最适合学习CPU设计的指令集。 * 开放免费：没有授权费，文档齐全，连寄存器编码都写得明明白白。 * 简洁清晰：RV32I只有40多条指令，没有x86那样层层嵌套的历史包袱。 * 模块化扩展：基础整数指令够用，后续想加浮点、压缩指令、向量扩展，都可以一步步来。

Cesium 无人机智能航线规划：航点动作组与AI识别实战

1. 从“点”到“任务”：理解智能航线规划的核心如果你用过一些基础的无人机航线规划工具，可能觉得“不就是在地图上点几个点，连成线让飞机飞过去”吗？确实，早期的航点飞行就是这么简单。但当你真正投入到巡检、测绘、安防这类复杂任务时，你会发现，单纯的“点对点”飞行远远不够。想象一下电力巡检的场景：无人机飞到第3号铁塔时，需要悬停、调整云台角度对准绝缘子串拍照；飞到第5号铁塔时，需要切换变焦镜头拍摄细节；在跨越河流的航线段，需要启动AI识别算法，自动监测河道漂浮物。这就不再是一条简单的“线”，而是一个由航点、动作、智能决策共同构成的三维空间任务流。这就是Cesium在无人机应用开发中的独特价值。它不仅仅是一个三维地球可视化库，更是一个强大的空间任务编排平台。基于Cesium，我们可以将地理空间坐标（航点）与丰富的动作指令（Action）以及AI识别逻辑绑定在一起，生成一个无人机能读懂、可执行的复杂任务剧本。我刚开始做这类项目时，也走过弯路，以为把航线画漂亮就行了。结果真机测试时，要么动作没执行，