英伟达抛弃了英特尔，沐鸣开户测速以其新的DGX A100向AMD靠拢

昨天，在英伟达的GPU技术大会上，所有人都知道了首席执行官黄延森(Jensen Huang)在做什么——他是伏特(volta)驱动的DGX-2深度学习系统的安培继任者。

周三，我们描述了黄厨房里神秘的硬件，除了特斯拉v100 GPU的新继承者之外，沐鸣开户测速可能还“装了一些Xeon的cpu”。新系统包括一对AMD Epyc 7742 64核，128线程的cpu，以及1TiB的RAM，一对1.9TiB的NVMe ssd在RAID1中作为引导驱动器，以及多达四个3.8TiB PCIe4.0 NVMe在RAID 0中作为辅助存储器。

再见英特尔，你好AMD

从技术上讲，英伟达将在其旗舰机器学习节点epyc中使用AMD的CPU，这并不奇怪。在技术方面，Epyc 7742对PCIe 4.0的支持可能比它的高CPU速度和大量内核/线程数更重要。

基于gpu的机器学习经常会在存储上出现瓶颈，而不是在CPU上。DGX A100使用的M.2和U.2接口各使用4个PCIe通道，这意味着从PCI Express 3.0到PCI Express 4.0的转变意味着每个SSD的可用存储传输带宽从32Gbps增加到64Gbps。

在改变CPU供应商的决定背后，可能也隐藏着一些政治因素。AMD可能是英伟达在利润相对较低的消费者图形市场上最大的竞争对手，但英特尔正在数据中心市场上奋力一搏。就目前而言，英特尔在离散gpu上的产品大多是蒸汽——但我们知道Chipzilla有更大、更宏伟的计划，因为它把它的重点从垂死的消费cpu市场转移到全数据中心。

英特尔的DG1是我们所见过的唯一真正的硬件，它已经泄露了一些基准数据，沐鸣开户测速让它与来自Ryzen 7 4800U的集成显卡GPU竞争。但是Nvidia可能更关心Xe HP 4-tile GPU，它的2048 EUs(执行单元)可能提供高达36 tflops——这将至少与今天发布的用于DGX的Nvidia A100 GPU大致相同。

DGX, HGX, SuperPOD和Jetson

DGX A100是今天宣布的焦点——它是一个独立的系统，有8个A100 GPU，每个GPU都有40gb的GPU内存。美国能源部阿贡国家实验室已经在使用一种DGX A100进行COVID-19研究。该系统的9个200Gbps Mellanox互连使集群多个DGX A100成为可能，但那些预算不支持大量20万美元GPU节点的人可以将A100 GPU划分为最多56个实例。

对于那些有预算购买和集群大量DGX A100节点的人来说，也可以使用HGX-Hyperscale数据中心加速器格式。Nvidia表示，一个“典型的云集群”由其早期的DGX-1节点以及用于推理训练的600个独立cpu组成，可以由5个DGX A100单元取代，能够处理这两种工作负载。这将使硬件从25个机架压缩到一个，电力预算从630kW压缩到28kW，成本从1100万美元压缩到100万美元。

如果HGX听起来还不够大，Nvidia也发布了它的参考架构——与Plume没有关系。英伟达的A100 SuperPOD通过170个Infiniband交换机连接了140个DGX A100节点和4PB闪存，沐鸣开户测速并提供了每秒700千万亿次的人工智能性能。英伟达已经在自己的SaturnV超级计算机上增加了4个超级豆荚，这至少让SaturnV成为了世界上最快的人工智能超级计算机。

最后，如果您不喜欢数据中心，您可以使用Jetson EGX A100在您的edge计算中使用A100。还有EGX Jetson Xavier NX。对于那些不熟悉的人来说，英伟达的Jetson单板平台可以被看作是steroids上的树莓派(Raspberry Pi)——它们可以部署在物联网场景中，但也为一个可以加固并嵌入机器人、医疗和无人机等边缘设备的小部件带来了强大的处理能力。

相关推荐：