MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm 

参考官网

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub 

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools 

4、下载llama.cpp release,硬要自己编译也可以

下载页

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型,里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中 

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top 

6、最终效果

如果你的token速度只有二十几,那就是纯cpu算的没跑了

在这里插入图片描述


amdgpu_top验证

在这里插入图片描述


注意,如果你要用其他电脑访问,需要增加参数–host 0.0.0.0,具体参考文档

Read more

.NET10之Web API Action参数来源自动推断

ASP.NET Core Web API 的 Action 参数来源自动推断(Binding Source Inference)是 [ApiController] 特性提供的核心便利机制,它能根据参数类型、名称、路由模板及依赖注入(DI)注册状态,自动决定参数从请求的哪个位置(路由、查询、Body、服务等)取值,大幅减少 [From*] 特性的手动标注。以下基于 ASP.NET Core 9/10 最新官方文档 深入解析,包含规则、问题解决、生产场景与完整可运行代码。 一、核心机制与默认推断规则(官方定义) 1. 启用条件 仅当控制器标注 [ApiController] 时,参数来源推断才自动生效。 2. 完整推断规则(

不用部署服务器,也能给前端 / 客户演示?内网穿透实战分享

不用部署服务器,也能给前端 / 客户演示?内网穿透实战分享

在日常开发中,经常会遇到一个很现实的问题:  功能已经在本地开发完成了,但前端同事、测试、客户都看不到效果。 很多人的第一反应是: 部署一套测试服务器。 但实际情况往往是 * 服务器没准备好 * 只是临时演示 * 改动频繁,反复部署很浪费时间 后来我发现,其实根本不需要部署服务器,用内网穿透就能很优雅地解决这个问题。 一、真实场景说明 场景 1:给前端联调接口 后端服务跑在本地: http://localhost:8080 问题是: * 前端在外地 * 无法访问本地接口 * 每次改接口都要重新部署 场景 2:给客户演示功能 * 新功能刚开发完 * 客户想先看看效果 * 但还没上线正式环境 这时候再去搞服务器,明显有点“杀鸡用牛刀”。 二、传统方案为什么不太合适? 对于“临时演示 / 联调”来说,都太重了。 三、解决方案:内网穿透 内网穿透的核心思路只有一句话: 把你本地的服务,

从被秒封到稳过Cloudflare!Canvas/WebGL/WebRTC多维度浏览器指纹隐身全实战

从被秒封到稳过Cloudflare!Canvas/WebGL/WebRTC多维度浏览器指纹隐身全实战

前阵子帮客户爬某跨境电商的商品数据,一开始信心满满:Puppeteer改了webdriver特征、UA池轮换、高匿代理池、行为模拟全拉满,结果30个节点一启动,访问首页直接被Cloudflare人机验证秒封,换IP、清Cookie全没用。 折腾了整整3天,抓包逆向了平台的反爬JS才发现,人家根本没看你那点基础伪装——直接拿Canvas、WebGL、WebRTC三个指纹做了关联校验,我30个节点的核心指纹完全一致,直接被标记成爬虫集群,封得明明白白。 后来我啃了几十篇反爬厂商的技术白皮书,踩穿了100+反爬平台的检测逻辑,终于摸出了一套多维度指纹隐身方案。现在这套方案跑了半年,稳过Cloudflare、Akamai、数美、顶象这些主流反爬,哪怕用同一台机器开100个实例,也不会被指纹关联识别。 今天把全流程掏出来,从原理、踩坑到代码实现,全是能直接落地的干货,网上90%的教程没讲透的核心细节,我全给你说明白。 一、先搞懂:为什么你的伪装永远被识破? 很多人对浏览器指纹的理解还停留在“改个UA、关了webdriver就完事”,但现在的反爬早就进入了多维度关联识别的时代。 1.

乡村政务办公系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

乡村政务办公系统信息管理系统源码-SpringBoot后端+Vue前端+MySQL【可直接运行】

摘要 随着乡村振兴战略的深入推进,乡村政务信息化建设成为提升基层治理能力的关键环节。传统的乡村政务管理方式存在效率低下、信息孤岛、数据共享困难等问题,亟需通过现代化信息技术手段进行优化升级。乡村政务办公系统信息管理系统的开发旨在实现政务信息的数字化、网络化和智能化管理,提高乡村政务工作的透明度和服务效率。该系统通过整合资源、优化流程,为乡村干部和村民提供便捷的政务办理和信息查询服务,推动乡村治理体系和治理能力现代化。关键词:乡村振兴、政务信息化、基层治理、数字化管理、服务效率。 本系统采用前后端分离架构,后端基于SpringBoot框架实现高效稳定的业务逻辑处理,前端使用Vue.js框架构建交互友好的用户界面,数据库采用MySQL存储和管理数据。系统功能涵盖用户管理、帮扶信息管理、新闻公告发布等模块,支持多角色权限控制,确保数据安全性。系统通过RESTful API实现前后端数据交互,并采用JWT进行身份认证,保障系统安全可靠。此外,系统还支持数据可视化展示,便于乡村政务数据的统计与分析。关键词:SpringBoot、Vue.js、MySQL、权限控制、数据可视化。 数据表设计