导航菜单
首页 >  沐鸣开户测速 >  » 正文

英伟达抛弃了英特尔,沐鸣开户测速以其新的DGX A100向AMD靠拢

沐鸣开户测速

昨天,在英伟达的GPU技术大会上,所有人都知道了首席执行官黄延森(Jensen Huang)在做什么——他是伏特(volta)驱动的DGX-2深度学习系统的安培继任者。
 
周三,我们描述了黄厨房里神秘的硬件,除了特斯拉v100 GPU的新继承者之外,沐鸣开户测速可能还“装了一些Xeon的cpu”。新系统包括一对AMD Epyc 7742 64核,128线程的cpu,以及1TiB的RAM,一对1.9TiB的NVMe ssd在RAID1中作为引导驱动器,以及多达四个3.8TiB PCIe4.0 NVMe在RAID 0中作为辅助存储器。
 
再见英特尔,你好AMD
 
从技术上讲,英伟达将在其旗舰机器学习节点epyc中使用AMD的CPU,这并不奇怪。在技术方面,Epyc 7742对PCIe 4.0的支持可能比它的高CPU速度和大量内核/线程数更重要。
 
基于gpu的机器学习经常会在存储上出现瓶颈,而不是在CPU上。DGX A100使用的M.2和U.2接口各使用4个PCIe通道,这意味着从PCI Express 3.0到PCI Express 4.0的转变意味着每个SSD的可用存储传输带宽从32Gbps增加到64Gbps。
 
在改变CPU供应商的决定背后,可能也隐藏着一些政治因素。AMD可能是英伟达在利润相对较低的消费者图形市场上最大的竞争对手,但英特尔正在数据中心市场上奋力一搏。就目前而言,英特尔在离散gpu上的产品大多是蒸汽——但我们知道Chipzilla有更大、更宏伟的计划,因为它把它的重点从垂死的消费cpu市场转移到全数据中心。
 
英特尔的DG1是我们所见过的唯一真正的硬件,它已经泄露了一些基准数据,沐鸣开户测速让它与来自Ryzen 7 4800U的集成显卡GPU竞争。但是Nvidia可能更关心Xe HP 4-tile GPU,它的2048 EUs(执行单元)可能提供高达36 tflops——这将至少与今天发布的用于DGX的Nvidia A100 GPU大致相同。
 
DGX, HGX, SuperPOD和Jetson
 
DGX A100是今天宣布的焦点——它是一个独立的系统,有8个A100 GPU,每个GPU都有40gb的GPU内存。美国能源部阿贡国家实验室已经在使用一种DGX A100进行COVID-19研究。该系统的9个200Gbps Mellanox互连使集群多个DGX A100成为可能,但那些预算不支持大量20万美元GPU节点的人可以将A100 GPU划分为最多56个实例。
 
对于那些有预算购买和集群大量DGX A100节点的人来说,也可以使用HGX-Hyperscale数据中心加速器格式。Nvidia表示,一个“典型的云集群”由其早期的DGX-1节点以及用于推理训练的600个独立cpu组成,可以由5个DGX A100单元取代,能够处理这两种工作负载。这将使硬件从25个机架压缩到一个,电力预算从630kW压缩到28kW,成本从1100万美元压缩到100万美元。
 
如果HGX听起来还不够大,Nvidia也发布了它的参考架构——与Plume没有关系。英伟达的A100 SuperPOD通过170个Infiniband交换机连接了140个DGX A100节点和4PB闪存,沐鸣开户测速并提供了每秒700千万亿次的人工智能性能。英伟达已经在自己的SaturnV超级计算机上增加了4个超级豆荚,这至少让SaturnV成为了世界上最快的人工智能超级计算机。
 
最后,如果您不喜欢数据中心,您可以使用Jetson EGX A100在您的edge计算中使用A100。还有EGX Jetson Xavier NX。对于那些不熟悉的人来说,英伟达的Jetson单板平台可以被看作是steroids上的树莓派(Raspberry Pi)——它们可以部署在物联网场景中,但也为一个可以加固并嵌入机器人、医疗和无人机等边缘设备的小部件带来了强大的处理能力。