MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

MS-S1 MAX,AI MAX 395在Ubuntu24利用Vulkan版llama.cpp运行gpt-oss 120b

1、安装amd gpu驱动和Rocm

wget https://repo.radeon.com/amdgpu-install/7.1.1/ubuntu/noble/amdgpu-install_7.1.1.70101-1_all.deb sudo apt install ./amdgpu-install_7.1.1.70101-1_all.deb sudo apt update sudo apt install "linux-headers-$(uname -r)" "linux-modules-extra-$(uname -r)" sudo apt install amdgpu-dkms sudo apt install python3-setuptools python3-wheel sudo usermod -a -G render,video $LOGNAME sudo apt install rocm 

参考官网

2、通过GTT解锁96G显存

1、进入bios->setup->advanced->NBIO common options->GFX configuration->UMA Frame buffer size改显存
2、修改grub

vim /etc/default/grub #设置保存 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash amd_iommu=off ttm.pages_limit=27648000 ttm.page_pool_size=27648000 amdttm.pages_limit=27648000 amdttm.page_pool_size=27648000 apparmor=0" update-grub 

重启生效
参考b站大佬

3、安装vulkan

sudo apt install vulkan-tools 

4、下载llama.cpp release,硬要自己编译也可以

下载页

wget https://github.com/ggml-org/llama.cpp/releases/download/b7503/llama-b7503-bin-ubuntu-vulkan-x64.tar.gz #进入目录 #去https://hf-mirror.com/ggml-org/collections中找自己想要部署的模型,里边有运行命令 ./llama-server -hf ggml-org/gpt-oss-120b-GGUF -c 0 --jinja #文件下载到~/.cache/llama.cpp/目录中 

5、安装amdgpu_top

sudo dpkg -i amdgpu-top_0.11.0-1_amd64.deb sudo amdgpu_top 

6、最终效果

如果你的token速度只有二十几,那就是纯cpu算的没跑了

在这里插入图片描述


amdgpu_top验证

在这里插入图片描述


注意,如果你要用其他电脑访问,需要增加参数–host 0.0.0.0,具体参考文档

Read more

Z-Image-ComfyUI未来展望:打造国产AIGC生态

Z-Image-ComfyUI未来展望:打造国产AIGC生态 1. 引言:从工具集成到生态构建 在人工智能生成内容(AIGC)快速发展的今天,图像生成技术已从“能否生成”迈入“如何高效落地”的新阶段。尽管国际主流文生图模型不断刷新参数规模与生成质量,但在中文语境下的实际应用中,仍普遍存在提示词理解偏差、文化元素失真、部署成本高昂等问题。 正是在此背景下,阿里推出的Z-Image系列模型与ComfyUI的结合,不再仅是一次简单的开源发布,而是标志着国产AIGC基础设施向高性能、低门槛、可扩展方向迈出的关键一步。Z-Image-ComfyUI不仅提供了一套完整的本地化解决方案,更通过开放架构为第三方插件和行业定制预留了广阔空间,具备成长为国产AIGC核心生态平台的潜力。 本文将围绕Z-Image的技术特性、ComfyUI的工程优势、系统集成逻辑以及未来生态发展方向展开深入分析,探讨如何基于这一组合构建一个可持续演进的国产AI图像生成生态系统。 2. 技术解析:Z-Image的核心能力与设计哲学 2.1 模型架构与变体设计 Z-Image是一个拥有60亿参数(6B)级别的扩

AI Coding 工具全方位对比:从 Copilot 到 Cursor,2026 年开发者如何选择?

AI Coding 工具全方位对比:从 Copilot 到 Cursor,2026 年开发者如何选择?

文章目录 * 一、AI 编程工具演进:四个阶段,三种范式 * 1.1 发展历程 * 1.2 三大技术流派 * 二、八大主流 AI 编程工具全景扫描 * 2.1 工具概览 * 三、十大维度深度对比 * 维度 1:代码补全准确率 * 维度 2:上下文理解能力 * 维度 3:响应速度 * 维度 4:多语言支持 * 维度 5:工程化能力 * 维度 6:企业级合规与安全 * 维度 7:生态集成能力 * 维度 8:学习曲线与易用性 * 维度 9:性价比分析 * 维度 10:

新手用AI写文章,AI味太重了?收藏这几个提示词瞬间去除AI写作痕迹!

现在很多新入局自媒体的人用AI辅助写作,但是稍有不慎就会被平台限流、封号。究其原因在于AI写的文字太AI风了,所以平台不会给流量! 要去除文章AI痕迹的核心思路是:第一步使用好提示词,好的提示词本身就降低了AI味道;第二步人工优化,在进一步降低AI味的同时还要修正错误和漏洞。 今天我把自己的经验结合起来,分享一下降低AI味的提示词。 一、赋予角色 给定一个具体的角色,比如说你在做育儿领域的爆款文章的时候,就可以给AI赋予一个资深育儿专家的身份。 举例:你是育儿专家,擅长写育儿类自媒体爆款文章。你主要的工作就是写出更有人情味、自然流畅、没有机器写作痕迹的文章,长短句并用,不用列表和总结,少用连接词,内容要打破AI生硬的感觉,在语言风格、情感表达、逻辑结构上全方位地接近人类真实的写作习惯。 二、人物画像 人物画像是对角色的补充,可以指定人物的年龄、性别、爱好等,做IP号的时候,就给AI发一张画像。 例子:语言风格转换专家,对于人类写作的特色有着非常深刻的认识。把AI生成的“冷冰冰”的文字转为通俗易懂、口语化的表达方式。依靠多年的积累,你能够很快地发现AI文本中重复啰嗦的

【VSCODE 插件 调试】 Visual Studio Code + Continue + Ollama实现本地版 Cursor / Copilot

【VSCODE 插件 调试】 Visual Studio Code + Continue + Ollama实现本地版 Cursor / Copilot

Visual Studio Code + Continue * 组合Visual Studio Code + Continue + Ollama 基本就是 本地版 Cursor / Copilot。,可以做到: * AI 自动写代码 * 自动改代码 * 解释代码 * 自动生成文件 * agent 自动执行命令 安装 Ollama 1. 安装 Ollama # macOS: brew install ollama # Linux: curl -fsSL https://ollama.com/install.sh | sh # windows: irm https://ollama.com/install.ps1 | iex 或者直接去官网下载安装 https://ollama.