MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm 

参考官网

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub 

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools 

4、下载llama.cpp release,硬要自己编译也可以

下载页

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型,里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中 

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top 

6、最终效果

如果你的token速度只有二十几,那就是纯cpu算的没跑了

在这里插入图片描述


amdgpu_top验证

在这里插入图片描述


注意,如果你要用其他电脑访问,需要增加参数–host 0.0.0.0,具体参考文档

Read more

合成测试数据革命:AIGC生成符合业务规则的高覆盖率测试数据集

合成测试数据革命:AIGC生成符合业务规则的高覆盖率测试数据集

测试数据困局与变革曙光‌ 在软件质量保障体系中,测试数据是驱动测试用例、验证系统功能的“血液”。然而,传统测试数据准备方式——如从生产环境脱敏抽取、手动构造或使用简单规则生成——正日益陷入成本高昂、覆盖不全、隐私合规风险大且难以模拟复杂业务场景的困局。 面对敏捷开发、持续交付以及日益复杂的业务逻辑,测试团队亟需一场数据供给侧的革新。以生成式人工智能为代表的AIGC技术,正以其强大的内容创造与规则理解能力,为这场“合成测试数据革命”提供了核心引擎,旨在自动化生成既高度贴合业务规则,又能实现极限场景与异常路径高覆盖的测试数据集,从而从根本上提升测试效率与软件质量。 一、 传统测试数据制备的痛点与挑战‌ 当前,软件测试从业者在数据准备阶段普遍面临多重挑战: 1.数据获取成本高昂‌:从生产环境抽取并完成合规脱敏,流程繁琐,资源消耗大,且脱敏后的数据可能失去原有的业务关联性,导致测试有效性降低。 2.覆盖率与真实性难以兼顾‌:手动构造的数据量有限,难以覆盖海量的参数组合、边界条件及异常流。简单的随机数据生成器无法理解和嵌入复杂的业务规则(如:“用户账户余额不足时不能发起转账”、“订单状态必

By Ne0inhk

Bidili SDXL Generator 5分钟快速部署:小白也能玩转AI绘画

Bidili SDXL Generator 5分钟快速部署:小白也能玩转AI绘画 你是不是也想过自己动手生成一张独一无二的AI画作,却被复杂的模型部署、参数配置劝退?今天,我要分享一个好消息:现在,你只需要5分钟,就能在自己的电脑上搭建一个功能强大的AI绘画工具——Bidili SDXL Generator。 这个工具基于目前最先进的Stable Diffusion XL 1.0模型,并集成了Bidili团队精心训练的LoRA风格权重。更重要的是,它专门针对SDXL架构做了显存优化,还提供了傻瓜式的可视化界面。无论你是完全没有AI基础的小白,还是想快速体验SDXL强大能力的开发者,这篇文章都能帮你轻松上手。 1. 为什么选择Bidili SDXL Generator? 在开始动手之前,我们先简单了解一下这个工具的核心价值。市面上AI绘画工具很多,但Bidili SDXL Generator有几个特别适合新手的优势。 1.1 开箱即用,告别复杂配置 传统的Stable Diffusion部署需要你懂Python环境、会安装各种依赖库、还要自己下载好几个G的模型文件。整个过程

By Ne0inhk
探索云开发Copilot,AI如何重塑开发流程?

探索云开发Copilot,AI如何重塑开发流程?

文章目录 * 1 AI与低代码 * 2 Copilot功能 * 3 案例解析 * 4 Copilot不足 * 5 改进建议 刚接触 Copilot 时, Copilot 的 AI 低代码生成功能让我眼前一亮,使得我开发变得更简洁高效。 以前,我总是依赖手写代码,从搭建环境到实现功能,每一步都非常耗时。 虽然这个过程有助于技术成长,但在面对复杂需求时,常常觉得费时费力。 1 AI与低代码 低代码平台通过拖拽组件和模块化开发,极大地降低了技术门槛,让没有开发背景的人也能轻松实现自己的创意。 这种方式不仅快速,而且灵活,适合那些想要快速搭建应用的用户。再加上人工智能在自然语言理解和代码生成方面的突破,开发效率也得到了极大的提升。 云开发 Copilot 正好是这种结合的典型代表。它不仅利用低代码技术简化开发过程,还融合了AI智能生成和优化的功能,帮助开发者更高效地从需求到最终实现。 通过这种方式,不管是技术新手还是有一定开发经验的人,都能更轻松地完成项目,云开发 Copilot 体验地址:https://tcb.

By Ne0inhk

ComfyUI Manager高效管理指南:提升AI绘画工作流的核心工具

ComfyUI Manager高效管理指南:提升AI绘画工作流的核心工具 【免费下载链接】ComfyUI-Manager 项目地址: https://gitcode.com/gh_mirrors/co/ComfyUI-Manager ComfyUI Manager是AI绘画爱好者不可或缺的效率工具,它通过集中管理插件、模型和环境配置,帮助用户轻松扩展ComfyUI功能,优化工作流程。本文将从功能价值、场景化应用到问题解决,全面介绍如何利用这一工具提升创作效率。 评估环境价值:系统兼容性检查 在开始使用ComfyUI Manager前,确保系统环境满足基本要求是避免后续问题的关键步骤。这不仅关系到工具能否正常运行,也影响到后续插件和模型的兼容性。 执行系统兼容性验证 1. 检查Python版本 * 方法一:终端执行python --version或python3 --version 2. 验证Git安装状态 * 基础检查:git --version * 进阶验证:git config --global --list确认用户配置 3. 评估系统资

By Ne0inhk