NVIDIA DGX Spark vs AMD Ryzen AI Max+ 395 深度对比
引言
2025 年,人工智能技术正以前所未有的速度发展,AI PC 作为连接个人用户与强大 AI 能力的桥梁,正在成为科技行业的新焦点。今天,我们将深入对比两款引领 AI PC 革命的旗舰产品:NVIDIA DGX Spark 和 AMD Ryzen AI Max+ 395,看看它们如何重新定义个人 AI 计算的边界。
NVIDIA DGX Spark:桌面上的 AI 超级计算机
核心架构与性能
NVIDIA DGX Spark 被誉为'您桌面上的 Grace Blackwell AI 超级计算机',它搭载了 NVIDIA 最新的 GB10 Grace Blackwell 超级芯片,这一架构在 FP4 精度下能够提供高达 1 petaFLOP 的 AI 性能。
关键规格:
- 处理器: NVIDIA Grace Blackwell 架构
- 内存: 128GB 统一寻址系统内存
- 网络: NVIDIA ConnectX 高性能网络
- 功耗: 仅 240W,能效比极高
- 尺寸: 紧凑型桌面设计
软件生态系统
DGX Spark 预装了完整的 NVIDIA AI 软件堆栈,包括 NVIDIA 工具和框架、优化的库和预训练模型、NVIDIA NIM 推理微服务以及 Docker 等开发环境。这种开箱即用的配置大大降低了 AI 模型在本地运行的门槛。
支持的主流开源大模型
凭借强大的硬件配置和优化的软件栈,DGX Spark 能够流畅运行当前主流的开源大模型:
超大参数模型
- GPT-OSS 120B: 预填充吞吐量约 2053 tokens/s,单 token 解码速度约 49.7 tokens/s
- Llama 3.1 70B: FP8 量化版,预填充速度约 803 tokens/s,生成速度约 2.7 tokens/s
- DeepSeek-R1: 推理速度快,性价比高
- Qwen3 系列: 包括 Qwen3-30B、Qwen3-235B 等
中大型模型
- Llama 3.1 8B: 预填充速度约 7991 tokens/s,每秒生成 20.5 tokens
- Gemma 3 系列
- DeepSpeed Coder 6.7B
技术亮点
- 双机互联能力: 通过 NVIDIA ConnectX 网络,可将两个 DGX Spark 系统连接,支持多达 4050 亿参数的 AI 模型
- EAGLE3 推测解码: 启用后可使端到端推理吞吐量提升最高约 2 倍
- 兼容 OpenAI API: 提供标准的 REST API 接口,可像使用 ChatGPT 一样与本地模型交互
- 多模型并行运行: 支持同时运行多个大模型,如 GPT-OSS 120B + DeepSpeed Coder 6.7B + Qwen-3 embedding
AMD Ryzen AI Max+ 395:消费级 AI PC 的新标杆
架构与性能表现
AMD Ryzen AI Max+ 395 代表了消费级 AI PC 的最高水平,它采用了先进的'Strix Halo'平台架构。
核心规格:
- AI 引擎: 集成 50 TOPS 算力的 NPU 计算单元

