MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

优质文章学习记录

06 Apr 2026 — 2 min read

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools

4、下载llama.cpp release，硬要自己编译也可以

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型，里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top

6、最终效果

如果你的token速度只有二十几，那就是纯cpu算的没跑了

在这里插入图片描述

amdgpu_top验证

在这里插入图片描述

注意，如果你要用其他电脑访问，需要增加参数–host 0.0.0.0，具体参考文档

Read more

【大模型:知识图谱】--6.Neo4j DeskTop安装+使用

【大模型:知识图谱】--6.Neo4j DeskTop安装+使用

上一期讲了图知识库的安装，【图数据库】--Neo4j 安装_neo4j安装-ZEEKLOG博客现在来看看可视化管理程序：Neo4j DeskTop的安装. 需要先安装java环境，具体看上面目录 1.Neo4j DeskTop版下载 2.Neo4j DeskTop版安装 3.Neo4j DeskTop版使用 3.1.本地实例 3.2.远程连接 3.3.导入数据 1.Neo4j DeskTop版下载 1、进入“Neo4j官网”下载DeskTop版本。好像需要科学上网：放一个网盘下载：通过网盘分享的文件：neo4j-desktop-2.0.2-x64.exe 链接: https://pan.baidu.com/s/1BIjfzdAGWGU19MJrmZIqJg?

发送webhook到飞书机器人

发送webhook到飞书机器人

发送webhook到飞书机器人参考链接自定义机器人使用指南创建自定义机器人 1. 邀请自定义机器人进群。 2. 3. 获取签名校验在安全设置区域，选择签名校验。获取自定义机器人的 webhook 地址机器人对应的 webhook 地址格式如下： https://open.feishu.cn/open-apis/bot/v2/hook/xxxxxxxxxxxxxxxxx 请妥善保存好此 webhook 地址，不要公布在 Gitlab、博客等可公开查阅的网站上，避免地址泄露后被恶意调用发送垃圾消息。设置自定义机器人的头像、名称与描述，并点击添加。在群机器人界面点击添加机器人。在添加机器人对话框，找到并点击自定义机器人。

Google VR SDK for Unity开发环境快速搭建指南

Google VR SDK for Unity是一个功能强大的开发工具包，专为在Unity引擎中构建沉浸式虚拟现实应用而设计。无论你是VR开发新手还是经验丰富的开发者，本指南都将帮助你快速配置完整的开发环境。【免费下载链接】gvr-unity-sdkGoogle VR SDK for Unity 项目地址: https://gitcode.com/gh_mirrors/gv/gvr-unity-sdk 项目概览与核心优势 Google VR SDK提供了完整的VR开发解决方案，从基础的头部追踪到高级的6自由度控制器交互。该SDK支持Daydream、Cardboard等多种VR平台，让开发者能够轻松创建跨设备的VR体验。主要功能特点 * 6自由度追踪：支持完整的空间定位和旋转 * 多平台兼容：适配Android和iOS设备 * 高性能渲染：优化的图形管线确保流畅体验 * 完整的输入系统：支持控制器、手势等多种交互方式环境搭建快速入门系统要求与必备工具在开始之前，请确保你的开发环境满足以下要求： Unity版本：2017.4或更高版本 Andr

YOLO+OpenClaw+SAM微调实战：工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战：工业缺陷自动标注的低代码落地

YOLO+OpenClaw+SAM微调实战：工业缺陷自动标注的低代码落地不能实时，不代表不能用。微调SAM+云端部署，让工业标注从“人工描边”变“一键验收”。大家好，我是AI小怪兽。上周有位做PCB质检的读者发来一段视频：标注员正对着一块电路板缺陷图，用鼠标一点点勾勒划痕的边界，一张图花了8分钟。他说：“YOLO能框，但框不准；SAM能分割，但通用模型到我们产线就水土不服。有没有办法让标注员少点鼠标？” 当然有。今天我就结合工业缺陷检测场景，展示一套低代码落地路径：YOLO粗定位 + 微调SAM精分割 + OpenClaw自动调度，让标注员从“动手画”变成“动口验收”。一、工业自动标注的三道坎坎1：OpenClaw无法实时推理 OpenClaw从接收指令到调用模型返回结果，5秒以上是常态。产线上的产品不可能等5秒，但标注任务可以——把数千张图丢给AI，让它半夜慢慢跑，员工早上来验收结果，不香吗？坎2：边缘端算力要求大，且存在安全风险 OpenClaw调用大模型需要至少8GB显存，