博客列表·第 10 页

C++AI算法

Intel GPU 加速 llama.cpp：SYCL 后端配置与性能调优指南

介绍如何利用 Intel Arc 显卡配合 SYCL 后端加速 llama.cpp 大语言模型推理。内容包括 Intel oneAPI 工具链安装与环境变量配置、CMake 编译参数优化、设备检测与权限设置、模型加载与内存管理策略。同时提供编译错误与运行时问题的解决方案，以及 GPU 利用率监控和性能基准测试方法，帮助开发者在 Intel GPU 上实现显著的性能提升。

ApiHolic发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 9 分钟阅读

C++

基于 ESP32 的无人机飞控日志 SD NAND 存储方案

基于 ESP32 芯片的无人机飞控系统采用 SD NAND 替代传统 SD 卡记录日志的方案。测试涵盖了芯片免驱动、坏块管理及尺寸兼容性等特性。通过姿态数据采集、LOG 目录创建及 Mission Planner 数据分析，验证了 SD NAND 在存储飞控日志时的稳定性和有效性，为无人机存储技术提供了新选择。

灰度发布发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 4 分钟阅读

C++AI算法

新版 llama.cpp 使用指南及 Llama 模型本地部署

如何使用 llama.cpp 在本地部署 Llama 大模型。内容包括环境搭建（编译 CUDA 支持）、模型格式转换（pth/hf 转 gguf）、量化处理、命令行交互及 API 服务启动，最后通过 Open WebUI 实现类 ChatGPT 的聊天界面。适合希望离线运行大模型的开发者参考。

菩提发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 46 分钟阅读

C++AI

llama.cpp 多环境部署指南：CPU 到 CUDA/Metal 高效推理

llama.cpp 在不同硬件环境下的部署指南。内容涵盖环境准备（CPU、Metal、CUDA）、源码获取与基础依赖安装、以及针对 CPU 和 Apple Silicon 的编译方法。文章旨在帮助用户在不升级显卡的情况下，利用 llama.cpp 实现大模型的本地离线推理，并提供了针对不同硬件平台的性能优化建议。

活在当下发布于 2026/4/6更新于 2026/4/137 浏览0 点赞约 4 分钟阅读

C++AI算法

llama.cpp 大模型部署指南：CPU/GPU 兼容与 Docker 快速启动

llama.cpp 工具的部署方法，支持 CPU 和 GPU 加速，可通过 Docker 快速启动。提供了 Qwen3-VL 多模态模型的配置示例，包含 Web UI 界面访问及 OpenAI 兼容 API 调用方法。适用于本地私有化部署，满足隐私需求及各类应用场景。

FlinkHero发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 10 分钟阅读

C++

HTTP 应用层协议详解与简易服务器实现

HTTP 协议的基本概念、请求与响应格式、常用方法（GET/POST）、状态码及 Header 字段。通过 C++ 代码演示了如何构建一个简单的 HTTP 服务器，实现了静态资源访问、重定向及动态交互功能。同时讲解了短连接与长连接的区别，以及 Cookie 和 Session 在无状态协议中的作用。最后通过 Fiddler 抓包验证了 HTTP 传输的不安全性，强调了 HTTPS 的重要性。

心动瞬间发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 40 分钟阅读

C++AI算法

机器人表情模拟实现：Arduino 控制面部舵机项目详解

介绍使用 Arduino 和 SG90 舵机实现机器人面部表情模拟的技术方案。内容包括舵机 PWM 控制原理、Servo 库代码示例、平滑过渡算法实现、多舵机独立供电解决方案及机械传动设计。项目成本低、门槛低，支持表情切换与扩展，适合嵌入式入门及情感化机器人开发。

机器人发布于 2026/4/6更新于 2026/4/134 浏览0 点赞约 14 分钟阅读

C++AI算法

91n 边缘计算设备部署轻量 TensorFlow 模型全流程

在算力受限的 91n 类边缘计算设备上部署轻量级 TensorFlow 模型的全流程。内容涵盖 TensorFlow Lite 的工程实践价值，包括模型量化转换与解释器加载；分析了 91n 设备的性能边界及软硬协同优化策略，如内存管理、温控与数据同步；提供了 C++ 层面的推理实现代码，对比了 Python 方案的优劣；最后展示了工业视觉缺陷检测等典型应用场景，强调了本地快速响应与远程集中管理的模式，为低成本低功耗条件下的 AI 落地提…

古灵精怪发布于 2026/4/6更新于 2026/4/133 浏览0 点赞约 16 分钟阅读

C++AI算法

Whisper.cpp CUDA 加速实践与性能优化

whisper.cpp 在 C/C++ 中集成 NVIDIA CUDA 技术进行语音识别加速的实践方案。内容涵盖环境配置、CMake 与 Makefile 编译方法、CUDA 参数优化、不同显卡等级的适配策略以及精度模式对比。通过 C++ 代码示例展示了如何在项目中集成 whisper.cpp 引擎及实现实时语音处理框架。实测数据显示，在 Intel i7-12700K 和 NVIDIA RTX 4080 环境下，相比纯 CPU 模式，…

小熊软糖发布于 2026/4/6更新于 2026/4/133 浏览0 点赞约 10 分钟阅读

C++AI算法

llama.cpp 多 GPU 分布式计算优化实践指南

介绍 llama.cpp 在多 GPU 环境下的性能优化方案。涵盖设备发现与调度机制、CMake 编译配置（CUDA/Metal/RPC）、自动与手动拆分模式选择、关键命令行参数调优（tensor-split/main-gpu）及性能监控工具使用。提供常见问题诊断方法如设备识别失败、显存溢出和负载不均衡的解决方案，并通过实测数据展示双 GPU 相比单 GPU 在加载速度和推理效率上的显著提升。

忘忧发布于 2026/4/6更新于 2026/4/131 浏览0 点赞约 10 分钟阅读

C++AI算法

使用 llama.cpp 部署本地大模型遇到的常见问题及解决方案

记录了使用 llama.cpp 部署本地大模型时的常见问题。主要涉及基础启动脚本配置、多分片模型合并方法，以及两个典型故障：一是 DeepSeek 模型在 SillyTavern 中因思考模式导致响应异常，需关闭 reasoning-budget 并指定自定义聊天模板；二是 llama-server 端口绑定失败，经排查为远程客户端占用冲突。提供了相应的参数调整与解决代码。

RedisGeek发布于 2026/4/6更新于 2026/4/133 浏览0 点赞约 18 分钟阅读

C++

XR 技术概览：理清 OpenVR、OpenXR、SteamVR 与厂商 SDK 的区别

系统对比了 OpenVR、OpenXR、SteamVR 及硬件厂商 SDK 四大概念。OpenVR 是 Valve 推出的初代 VR 标准；OpenXR 是 Khronos Group 制定的跨 VR/AR/MR 通用标准；SteamVR 是基于 OpenVR 的 PC VR 运行时平台；厂商 SDK 则是设备专属底层工具。开发者应以 OpenXR 为核心标准，按需搭配运行时或 SDK 实现落地运行，兼顾兼容性与硬件能力。

赛博行者发布于 2026/4/6更新于 2026/4/134 浏览0 点赞约 16 分钟阅读

C++AI算法

软体机器人动作捕捉系统：6 大主流方案深度测评与选型指南

对软体机器人研发中的动作捕捉需求，客观评测了 NOKOV、Motion Analysis、从仔、Astra、华为海思及大疆 RoboMaster 六款主流方案。通过对比定位精度、采样频率、环境适应性及成本等核心指标，分析了各方案在医疗手术、水下作业、工业装配及高校教学等不同场景下的适用性，为技术选型提供数据支撑与决策建议。

奇形怪状发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 24 分钟阅读

C++AI算法

工业级存储芯片 CSNP32GCR01-AOW 在无人机飞控系统中的应用实践

探讨了基于全志 MR100 主控与 CSNP32GCR01-AOW 工业级 SD NAND 芯片的无人机飞控存储方案。针对无人机在恶劣环境下对数据存储可靠性、高耐久性及宽温工作的严苛需求，该方案采用贴片式存储替代传统 TF 卡，解决了振动松动与寿命短的问题。实测显示，该芯片在顺序读写与随机读写性能上满足 4K 视频流及高频日志记录要求，容量真实且数据完整性校验通过。此方案为高端工业无人机提供了稳定可靠的数据黑匣子保障。

moshang发布于 2026/4/6更新于 2026/4/134 浏览0 点赞约 19 分钟阅读

C++AI算法

C++高性能推理优化全解析：AIGC 场景下吞吐量提升策略

深入解析了 C++ 在 AIGC 场景下的高性能推理优化策略。内容涵盖计算图优化（算子融合、常量折叠）、内存管理（内存池、零拷贝）、并行加速（SIMD、多线程）及架构设计（批处理、负载均衡）。通过量化对比与代码示例，展示了如何识别性能瓶颈、消除冗余计算、优化缓存局部性以及构建异步推理流水线。文章结合了实际测试数据，论证了优化措施对吞吐量与延迟的显著改善效果，为构建可持续演进的高性能推理引擎提供了理论与实践指导。

片刻发布于 2026/4/6更新于 2026/4/131 浏览0 点赞约 25 分钟阅读

C++AI算法

从卡顿到流畅：Tesla K80 显卡上的 llama.cpp CUDA 优化实战指南

介绍如何在 Tesla K80 显卡上通过五步 CUDA 优化法提升 llama.cpp 推理性能。主要步骤包括：配置 CUDA Toolkit 11.7 及指定 Compute Capability 3.7 编译参数；采用混合量化策略（Q4_K_M）并保留部分 FP16 内存；调整运行时参数如 batch size 和上下文窗口；设置环境变量优化显存管理和任务并发。优化后生成速度从 3.2 tokens/秒提升至 12.5 token…

黑客发布于 2026/4/6更新于 2026/4/134 浏览0 点赞约 13 分钟阅读

C++AI算法

whisper.cpp 跨平台语音识别部署指南

whisper.cpp 是 OpenAI Whisper 模型的 C/C++ 移植版本，支持本地离线语音识别。在 Windows、Linux、macOS 及 Android 平台的部署流程，涵盖环境配置、模型下载与量化、编译构建、性能优化及常见问题排查。通过合理选择模型精度与硬件加速，可实现高效的语音转文字服务，适用于个人使用或企业级应用。

栈溢出发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 6 分钟阅读

C++AI算法

WSL2 Ubuntu 部署 llama.cpp 指南

在 WSL2 Ubuntu 环境下部署 llama.cpp 的完整流程。内容包括通过 Git 克隆仓库，安装编译依赖（build-essential, cmake 等），分别演示了 CPU 和 GPU（CUDA）版本的编译配置及环境变量设置。此外，还说明了如何在 Windows 主机安装 NVIDIA 驱动及 WSL CUDA Toolkit，并通过 nvidia-smi 验证 GPU 可用性。最后提供了从 Hugging Face 和…

氛围发布于 2026/4/6更新于 2026/4/133 浏览0 点赞约 11 分钟阅读

C++AI算法

OpenREALM：无人机实时映射框架的技术深度解析

OpenREALM 是一款开源无人机实时映射框架，融合视觉 SLAM、单目稠密重建等技术，解决传统方案数据处理滞后问题。框架采用三层架构，支持四种操作模式，涵盖从 2D 拼接至 3D 重建。实验表明其在姿态估计精度、表面重建质量及正射影像效果上表现良好，满足实时决策需求，为精准农业和应急救援提供技术支撑。

微码行者发布于 2026/4/6更新于 2026/4/133 浏览0 点赞约 43 分钟阅读

C++算法

SimVascular 心血管建模高效使用技巧

介绍 SimVascular 心血管建模的高效使用方法。涵盖环境配置、系统兼容性检查、医学影像导入与预处理流程。详细阐述血管建模关键步骤（分割、路径规划、重建）及血流模拟参数设置。提供内存管理、计算资源利用等性能优化策略，并解答构建失败、运行崩溃及结果不收敛等常见问题。旨在帮助用户掌握从新手到专家的成长路径，提升心血管疾病研究与临床应用的效率。

微码行者发布于 2026/4/6更新于 2026/4/132 浏览0 点赞约 6 分钟阅读

排序