NVIDIA DGX Spark支持4台集群组网！性能线性飙升

快科技3月17日消息，NVIDIA 宣布，DGX Spark迎来全新功能，现已支持最多4台设备集群组网，从而搭建紧凑型的"桌面数据中心"。

被大家昵称"小金盒"的DGX Spark单台具备1千万亿次每秒的AI算力，搭配128GB LPDDR5X统一内存，四台并行就具备4千万亿次的算力和512GB统一内存。

DGX Spark现已支持多种运行拓扑结构，都依托ConnectX-7网卡提供的低延迟RoCE通信，针对不同目标做了专门优化：

单节点：

适合低延迟、大上下文长度推理，可推理最高2000亿参数模型、微调最高1200亿参数模型，以及本地智能体类工作负载。

双节点：

均衡扩展，可更快完成微调、支持更大模型，可支撑最高4000亿参数模型的推理。

三节点（环形拓扑）：

适合更大模型微调或小型训练任务。

四节点（搭配RoCE 200GbE交换机）：

可作为本地推理服务器，完美支持最高7000亿参数的前沿大模型、通信密集型工作负载，以及本地AI工厂运营。

NVIDIA号称，DGX Spark多台并行，可以实现接近线性的性能扩展提升，而且不需要像传统机架式服务器部署那样的复杂配置。

比如Isaac Lab强化学习性能，单节点性能630FPS，双节点翻番至1241FPS，四节点再次翻番至2520FPS，而延迟基本不变。

再比如Nanochat微调的性能，单节点Token输出速度为每秒约1.84万，双节点翻番至3.59万，四节点再次翻番至7.46万。

同时，NVIDIA还推出了全新的NVIDIA NemoClaw开源技术栈，DGX Spark可提供全栈平台，支持在本地构建、运行长期自主运行的AI智能体，后续也能无缝扩展至AI工厂等数据中心基础设施。

此外，DGX Spark还即将迎来新的软件版本，可进一步提升编排与管理能力，加速从原型到生产的迭代。

目前，金融、医疗、能源、通信等众多行业机构均已部署DGX Spark。

可以说，DGX Spark的这次重磅升级，再次彰显了NVIDIA在AI硬件架构与技术生态的双重领先地位。

从单设备到集群部署，从本地开发到企业级落地，NVIDIA再次以遥遥领先的技术与前瞻性的布局，定义了桌面级AI基础设施的新标杆，巩固了在全球AI算力领域的绝对领先优势。

从双节点到四节点，企业用户未来能够更高效地利用DGX Spark的算力优势，实现AI业务的快速落地，推进AI智能体的广泛落地。

[责编：{getone name="zzc/mingzi"/}]

阅读剩余全文（）

全部导航