MS-S1 MAX，AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

优质文章学习记录

07 Apr 2026 — 2 min read

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools

4、下载llama.cpp release，硬要自己编译也可以

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型，里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top

6、最终效果

如果你的token速度只有二十几，那就是纯cpu算的没跑了

在这里插入图片描述

amdgpu_top验证

在这里插入图片描述

注意，如果你要用其他电脑访问，需要增加参数–host 0.0.0.0，具体参考文档

Read more

OpenClaw 完整安装与配置文档（包含Minimax/deepseek模型接入、飞书机器人接入）

OpenClaw 完整安装与配置文档文档说明：本文档适用于 Linux 系统（Debian/Ubuntu 系列），详细梳理 OpenClaw 从基础环境准备、核心程序安装，到模型配置（Minimax/DeepSeek）、飞书渠道对接的全流程，所有交互式配置选项完整呈现，步骤可直接复制执行，适配新手操作。适用场景：OpenClaw 新手部署、企业内部飞书机器人对接、Minimax/DeepSeek 模型配置前置说明： 1. 服务器需联网，确保能访问 GitHub、npm、飞书官网； 2. 操作全程使用终端命令行，建议使用远程工具（如 Xshell、Putty）连接服务器； 3. 复制命令时需完整复制，避免遗漏特殊符号； 4. 所有交互式配置选项均完整列出，按文档指引选择即可。 5. 拥有root用户/sudo权限。

苍穹外卖(前端)

苍穹外卖(前端)

创建前端工程：环境要求：基于脚手架创建前端工程，需要具备如下环境要求： node.js：前端项目的运行环境 npm：JavaScript 的包管理工具 Vue CLI：基于 Vue 进行快速开发的完整系统，实现交互式的项目脚手架操作过程：使用 Vue CLI 创建前端工程方式一：vue create 项目名称方式二：vue ui 工程结构：文件/目录介绍node_modules当前项目依赖的 js 包assets静态资源存放目录components公共组件存放目录App.vue项目的主组件，页面的入口文件main.js整个项目的入口文件package.json项目的配置信息、依赖包管理vue.config.jsvue-cli 配置文件启动服务：使用 VS Code 打开创建的前端工程，启动前端工程：访问前端工程：在

最新版 springdoc-openapi-starter-webmvc-ui 常用注解详解 + 实战示例

当然可以！在 Spring Boot 3 + SpringDoc OpenAPI（Swagger 3 替代方案）生态中，springdoc-openapi-starter-webmvc-ui 是目前官方推荐的集成方式。它提供了一套丰富的注解，用于精细化控制 API 文档的生成，提升前端、测试、产品等协作方的体验。 ✅ 最新版 springdoc-openapi-starter-webmvc-ui 常用注解详解 + 实战示例 📌 当前最新稳定版本：springdoc-openapi 2.5+（2025年仍适用） 📌 所有注解位于包：io.swagger.v3.oas.annotations.* 🧩 一、核心注解概览注解作用适用位置@OpenAPIDefinition全局 API 信息配置（标题、版本、联系人等）@Configuration 类@Tag标记 Controller 或方法所属的“标签/

Android WebRTC 视频通话开发实战：从零搭建到性能调优

快速体验在开始今天关于 Android WebRTC 视频通话开发实战：从零搭建到性能调优的探讨之前，我想先分享一个最近让我觉得很有意思的全栈技术挑战。我们常说 AI 是未来，但作为开发者，如何将大模型（LLM）真正落地为一个低延迟、可交互的实时系统，而不仅仅是调个 API？这里有一个非常硬核的动手实验：基于火山引擎豆包大模型，从零搭建一个实时语音通话应用。它不是简单的问答，而是需要你亲手打通 ASR（语音识别）→ LLM（大脑思考）→ TTS（语音合成）的完整 WebSocket 链路。对于想要掌握 AI 原生应用架构的同学来说，这是个绝佳的练手项目。从0到1构建生产级别应用，脱离Demo，点击打开从0打造个人豆包实时通话AI动手实验 Android WebRTC 视频通话开发实战：从零搭建到性能调优移动端P2P视频通话的三大挑战开发Android端视频通话应用时，我们常遇到几个核心难题： * NAT穿透/NAT Traversal：