零刻AI Max395(Ubuntu 24.04)AMD 显卡监控工具(amdgpu_top)部署手册

零刻AI Max395(Ubuntu 24.04)AMD 显卡监控工具(amdgpu_top)部署手册

       同事购置一台零刻AI Max395,已装Ubuntu 24.04,拿来玩耍,打算部署GLM-4.7,需要设置显存突破96GB限制(因Max 395 BIOS中可分配的最大显存为96G,为能够运行101G的模型权重,需通过Linux GTT来设置显存突破96G的限制)。rocm-smi回显信息有限,安装amdgpu_top监控工具。

rocm-smi回显如下:

设置显存突破96GB限制

vim /etc/default/grub #编辑grub文件,修改参数 ######## GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=31457280 ttm.page_pool_size=31457280 amdttm.pages_limit=31457280 amdttm.page_pool_size=31457280 apparmor=0 zswap.enabled=1 zswap.compressor=zstd zswap.zpool=zsmalloc zswap.max_pool_percent=5" ######## :wq update-grub #编辑完成后运行,运行完毕重启 amdgpu_top #回显如下 ____________________________________________________ (base) root@lisinan-GTR:~# amdgpu_top amdgpu_top:未找到命令 (base) root@lisinan-GTR:~# ^C

amdgpu_top监控工具部署:

amdgpu_top是专门用于监控 AMD 显卡(适配 amdgpu 驱动)状态的工具,Ubuntu 24.04 默认 apt 软件源中没有该工具,无法直接通过apt install安装,需要通过源码编译或 AMD 官方工具包安装,其中源码编译是最稳定、适配性最强的方式。

安装编译amdgpu_top所需的基础工具和依赖库,以 root 身份执行以下命令

apt update && apt upgrade -y # 更新系统软件源 apt install -y git cmake g++ libdrm-dev libncurses-dev libncursesw5-dev pkg-config # 安装核心编译依赖和依赖库

源码编译安装

git clone https://github.com/Umio-Yasuno/amdgpu_top.git #克隆amdgpu_top官方源码仓库

进入源码目录,创建构建目录并配置编译环境

cd amdgpu_top # 进入源码目录 mkdir build && cd build # 创建构建目录(规范编译流程,避免污染源码文件)

amdgpu_top采用 Rust 开发,需通过cargo工具构建,而非cmake;

上图是过程中,Rust 已存在导致的 rustup 安装报错

终端提示你系统/usr/bin目录下已经预装了 Rust,而rustup是 Rust 的官方版本管理工具,默认希望成为系统的「唯一 Rust 环境」,因此触发了路径检查警告,最终报错cannot install while Rust is installed。

解决方案:跳过路径检查,直接安装 rustup。无需卸载系统预装的 Rust,通过添加参数跳过路径检查,直接完成安装,后续可通过rustup管理 Rust 版本,避免冲突。

执行带跳过参数的安装命令

curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh -s -- -y #添加 -y 参数,忽略所有可跳过的检查(包括路径检查) ls -l #验证 amdgpu_top 项目文件完整性,查看当前目录下的项目文件(核心文件包括Cargo.toml、src/目录,缺一不可)

配置 Rust 环境变量(安装完成后必须执行)

安装完成后,需要加载环境变量,让系统识别rustup和cargo(Rust 的包管理工具):

source "$HOME/.cargo/env" # 加载环境变量(临时生效,当前终端窗口有效) echo "source $HOME/.cargo/env" >> ~/.bashrc #(可选)配置永久生效(后续新开终端也能直接使用) source ~/.bashrc

验证安装是否成功

rustup --version # 查看rustup版本 rustc --version # 查看rust版本 cargo --version # 查看cargo版本

Release 模式编译,如果后续需要长期使用amdgpu_top监控硬件,推荐用 Release 模式编译

cargo build --release #优化编译,去除调试信息,运行效率提升30%以上,编译耗时,耐心等待即可,提示"Finished `release` profile [optimized] target(s) in 1m 27s"即表示编译成功

安装到全局路径(可直接输入amdgpu_top运行)

将可执行文件安装到~/.cargo/bin目录(该目录已配置到环境变量,系统可全局识别),后续在任何目录下输入amdgpu_top即可运行,无需指定路径。

# cargo install --path .(--path . 表示当前项目目录) # 该命令会将编译后的Release版本文件复制到~/.cargo/bin,实现全局调用 cargo install --path . #安装成功后,全局运行amdgpu_top(任何目录下都可执行) amdgpu_top

amdgpu_top回显如下:

Read more

OpenClaw 完整部署指南:安装 + 三大 Coding Plan 配置 + CC Switch + 飞书机器人

OpenClaw 完整部署指南:安装 + 三大 Coding Plan 配置 + CC Switch + 飞书机器人

OpenClaw 完整部署指南:安装 + 三大 Coding Plan 配置 + CC Switch + 飞书机器人 * 📋 文章目录结构 * 1.3 一键安装 OpenClaw(推荐) * 1.4 通过 npm 手动安装 * 1.5 运行 Onboard 向导 * 1.6 验证安装 * 步骤二:配置 Coding Plan 模型 * 🅰️ 选项 A:阿里百炼 Coding Plan * A.1 订阅与获取凭证 * A.2 在 OpenClaw 中配置 * A.3 可用模型列表

【无人机避障算法核心技术】:揭秘五种主流算法原理与实战应用场景

第一章:无人机避障算法概述 无人机避障算法是实现自主飞行的核心技术之一,其目标是在复杂环境中实时感知障碍物,并规划安全路径以避免碰撞。随着传感器技术和计算能力的提升,避障系统已从简单的距离检测发展为融合多源信息的智能决策体系。 避障系统的基本组成 典型的无人机避障系统包含以下关键模块: * 感知模块:利用激光雷达、超声波、立体视觉或RGB-D相机获取环境数据 * 数据处理模块:对原始传感器数据进行滤波、特征提取和障碍物识别 * 决策与规划模块:基于环境模型生成避障轨迹,常用算法包括A*、Dijkstra、RRT和动态窗口法(DWA) 常见避障算法对比 算法优点缺点适用场景A*路径最优,搜索效率高高维空间计算开销大静态环境全局规划DWA实时性强,适合动态避障局部最优风险室内低速飞行RRT*渐进最优,适应复杂空间收敛速度慢三维未知环境 基于深度学习的避障方法示例 近年来,端到端神经网络被用于直接从图像生成控制指令。以下是一个简化的行为克隆模型推理代码片段: import torch import torchvision.transforms as tran

2026实测|DeepSeek-R1-Distill-Qwen-1.5B部署全攻略(vLLM+Open WebUI,0.8GB显存就能跑,告别服务器瓶颈)

2026实测|DeepSeek-R1-Distill-Qwen-1.5B部署全攻略(vLLM+Open WebUI,0.8GB显存就能跑,告别服务器瓶颈)

前言:2026年,轻量级大模型部署已成为开发者核心需求——专业GPU服务器成本高昂、边缘设备算力有限,多数1.5B级模型仍需3GB以上显存,让个人开发者与中小企业望而却步。而DeepSeek-R1-Distill-Qwen-1.5B(下称“DQ-1.5B”)的出现打破僵局,通过知识蒸馏技术在1.5B参数体量下实现接近7B级模型的推理能力,配合vLLM推理加速与Open WebUI可视化交互,实测0.8GB显存即可稳定运行,无需高端服务器,个人PC、边缘设备均可轻松落地。本文结合2026年最新实测数据,从核心原理、分步实操、实测验证、应用场景、落地案例到问题排查,打造零冗余、高可用的部署全攻略,兼顾专业性与实用性,助力开发者快速上手,轻松实现轻量级大模型本地化部署。 一、核心技术解析 部署前先理清三大核心组件的核心逻辑,无需深入底层源码,聚焦“为什么能用、为什么高效”,贴合开发者落地需求。 1.1 模型核心:DeepSeek-R1-Distill-Qwen-1.5B 优势解析 DQ-1.5B是DeepSeek团队基于Qwen-1.

LIBWEBKIT2GTK-4.1-0实战:构建一个轻量级浏览器

快速体验 1. 打开 InsCode(快马)平台 https://www.inscode.net 2. 输入框内输入如下内容: 开发一个轻量级浏览器应用,基于LIBWEBKIT2GTK-4.1-0,支持多标签页、书签管理和基本的导航功能。应用应包含一个简洁的UI,允许用户输入URL并显示网页内容。使用DeepSeek模型生成核心渲染代码,并确保应用在Linux环境下流畅运行。 1. 点击'项目生成'按钮,等待项目生成完整后预览效果 最近在折腾一个轻量级浏览器的开发项目,用到了LIBWEBKIT2GTK-4.1-0这个库,发现它真是个宝藏工具。今天就把整个实战过程整理成笔记,分享给同样对浏览器开发感兴趣的小伙伴们。 1. 环境准备与基础搭建 首先得确保系统安装了LIBWEBKIT2GTK-4.1-0库。在Ubuntu/Debian系系统里,一条简单的apt命令就能搞定。这个库基于WebKit引擎,提供了GTK+的接口封装,特别适合用来开发轻量级的图形界面浏览器。 1. 创建基础窗口结构 用GTK+创建主窗口时,需要设置好标题、