NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比

引言

2025 年，人工智能技术正以前所未有的速度发展，AI PC 作为连接个人用户与强大 AI 能力的桥梁，正在成为科技行业的新焦点。今天，我们将深入对比两款引领 AI PC 革命的旗舰产品：NVIDIA DGX Spark 和 AMD Ryzen AI Max+ 395，看看它们如何重新定义个人 AI 计算的边界。

NVIDIA DGX Spark：桌面上的 AI 超级计算机

核心架构与性能

NVIDIA DGX Spark 被誉为'您桌面上的 Grace Blackwell AI 超级计算机'，它搭载了 NVIDIA 最新的 GB10 Grace Blackwell 超级芯片，这一架构在 FP4 精度下能够提供高达 1 petaFLOP 的 AI 性能。

关键规格：

处理器： NVIDIA Grace Blackwell 架构
内存： 128GB 统一寻址系统内存
网络： NVIDIA ConnectX 高性能网络
功耗： 仅 240W，能效比极高
尺寸： 紧凑型桌面设计

软件生态系统

DGX Spark 预装了完整的 NVIDIA AI 软件堆栈，包括 NVIDIA 工具和框架、优化的库和预训练模型、NVIDIA NIM 推理微服务以及 Docker 等开发环境。这种开箱即用的配置大大降低了 AI 模型在本地运行的门槛。

支持的主流开源大模型

凭借强大的硬件配置和优化的软件栈，DGX Spark 能够流畅运行当前主流的开源大模型：

超大参数模型

GPT-OSS 120B： 预填充吞吐量约 2053 tokens/s，单 token 解码速度约 49.7 tokens/s
Llama 3.1 70B： FP8 量化版，预填充速度约 803 tokens/s，生成速度约 2.7 tokens/s
DeepSeek-R1： 推理速度快，性价比高
Qwen3 系列： 包括 Qwen3-30B、Qwen3-235B 等

中大型模型

Llama 3.1 8B： 预填充速度约 7991 tokens/s，每秒生成 20.5 tokens
Gemma 3 系列
DeepSpeed Coder 6.7B

技术亮点

双机互联能力： 通过 NVIDIA ConnectX 网络，可将两个 DGX Spark 系统连接，支持多达 4050 亿参数的 AI 模型
EAGLE3 推测解码： 启用后可使端到端推理吞吐量提升最高约 2 倍
兼容 OpenAI API： 提供标准的 REST API 接口，可像使用 ChatGPT 一样与本地模型交互
多模型并行运行： 支持同时运行多个大模型，如 GPT-OSS 120B + DeepSpeed Coder 6.7B + Qwen-3 embedding

AMD Ryzen AI Max+ 395：消费级 AI PC 的新标杆

架构与性能表现

AMD Ryzen AI Max+ 395 代表了消费级 AI PC 的最高水平，它采用了先进的'Strix Halo'平台架构。

核心规格：

AI 引擎： 集成 50 TOPS 算力的 NPU 计算单元

特性	NVIDIA DGX Spark	AMD Ryzen AI Max+ 395
AI 性能	1 petaFLOP (FP4)	126 TOPS
NPU 算力	-	50 TOPS
内存	128GB 统一内存	128GB 统一内存
最大模型支持	4050 亿参数（双机）	2350 亿参数
功耗	240W	消费级功耗
定位	专业工作站	消费级 AI PC

模型	NVIDIA DGX Spark	AMD Ryzen AI Max+ 395
GPT-OSS 120B	49.7 tokens/s	30-40 tokens/s
Llama 3.1 70B	2.7 tokens/s	-
Qwen3-235B	-	14+ tokens/s
Llama 3.1 8B	20.5 tokens/s	-

NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比