新闻

TOP500在低周转期间扩展Exaflops能力

德国法兰克福;加州伯克利;还有田纳西州诺克斯维尔在TOP500的第56版中,日本Fugaku超级计算机巩固了其排名第一的位置,该列表反映了平坦的性能增长曲线。尽管有两个新系统成功进入前十名,但自1993年该项目开始以来,完整列表记录的新条目数量最少。

在高性能Linpack(HPL)基准上,该列表的入门级排名上升到1.32 petaflops,比2020年6月排名中记录的1.23 petaflops小幅增长。同样,所有500个系统的综合性能从6月的2.22 exaflops增长到最新列表中的2.43 exaflops。同样,每个系统的平均并发性几乎没有增加,从六个月前的145,363核增加到当前列表中的145,465核。

但是,前十名中有一些值得注意的发展,包括两个新系统,以及排名前十的新高水位线 Fugaku超级计算机。得益于额外的硬件,Fugaku将其HPL性能提高到442 petaflops,比2020年6月首次亮相时的416 petaflops有所增加。更重要的是,Fugaku将新混合精度HPC-AI基准测试的性能提高到2.0 exaflops。 ,刷新了六个月前创下的1.4 exaflops的记录。这些代表了在任何类型的硬件上任何精度的一次exaflop以上的首次基准测试。

以下是当前十大系统的简要概述:

  • Fugaku仍然位居榜首,其Arm A64FX容量从7,299,072核增加到7,630,848核。额外的硬件在HPL上实现了442 petaflops的新世界纪录。这使它比列表中的第二系统高出三倍。 Fugaku由Fujitsu建造,并安装在日本神户的RIKEN计算科学中心(R-CCS)中。
  • Summit是IBM在田纳西州橡树岭国家实验室(ORNL)建造的系统,它仍然是美国最快的系统,性能为148.8 petaflops。 Summit拥有4,356个节点,每个节点包含两个22核Power9 CPU和六个NVIDIA Tesla V100 GPU。
  • Sierra是加州劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的系统,其HPL标记为94.6 petaflops位居第三。它的架构与Summit的架构非常相似,每个4,320个节点都配备了两个Power9 CPU和四个NVIDIA Tesla V100 GPU。
  • 双威TaihuLight,由中国国家并行计算机工程研究中心开发的系统&位于无锡国家超级计算中心的Technology(NRCPC)排名第四。它仅由Sunway SW26010处理器供电,在HPL上达到93 petaflops。
  • 排在第五位的是Selene,这是在NVIDIA Corp.内部安装的NVIDIA DGX A100 SuperPOD。它在6月被列为第七名,但尺寸增加了一倍,使其可以在列表中上移两个位置。该系统基于AMD EPYC处理器和NVIDIA的新型A100 GPU进行加速。升级后,Selene在HPL上获得了63.4 petaflops。
  • 由中国国防科技大学(NUDT)开发并部署在广州的国家超级计算机中心的“天河2A”(银河2A)排名第六。它由Intel Xeon CPU和NUDT的Matrix-2000 DSP加速器提供动力,在HPL上达到61.4 petaflops。
  • 一种新的超级计算机,称为JUWELS Booster Module,在该列表中排名第七。 Atos制造的BullSequana机器最近安装在德国的ForschungszentrumJülich(FZJ)。它是模块化系统体系结构的一部分,第二个基于Xeon的JUWELS模块在TOP500的位置44上单独列出。这些模块通过使用ParTec Modulo Cluster Software Suite进行集成。 Booster模块将AMD EPYC处理器与NVIDIA A100 GPU配合使用,以实现类似于第五个Selene系统的加速。单独运行JUWELS Booster Module可以达到44.1 HPL petaflops,这使其成为欧洲功能最强大的系统
  • 由意大利公司Eni S.p.A.安装的Dell PowerEdge系统HPC5排名第8。它使用Intel Xeon Gold CPU和NVIDIA Tesla V100 GPU达到35.5 petaflops的性能。它是列表中功能最强大的系统,用于客户现场的商业用途。
  • Frontera是去年在德克萨斯大学的德克萨斯高级计算中心安装的Dell C6420系统,现在排名第九。它使用448,448个Intel Platinum Xeon内核实现了23.5 petaflops。
  • 列表顶部的第二个新系统是Dammam-7,排名第10。它安装在沙特阿拉伯的沙特阿美(Saudi Aramco)上,是目前排名前10位中的第二台商用超级计算机。HPE Cray CS-Storm系统使用Intel Gold Xeon CPU和NVIDIA Tesla V100 GPU。在HPL基准测试中达到22.4 petaflops。

其他TOP500亮点

名单上共有149个系统正在使用加速器/协处理器技术,而六个月前为146个。其中140个使用NVIDIA芯片。

在90%以上装有Xeon或Xeon Phi芯片的系统中,英特尔继续在TOP500处理器份额中占据主导地位。尽管最近高性能计算中替代处理器架构的兴起,AMD处理器(包括Hygon芯片)在当前列表中仅代表21个系统,另外还有10个基于Power的系统和5个基于Arm的系统。但是,配备AMD处理器的系统数量比六个月前增加了一倍。

与最近的列表相比,系统互连的故障在很大程度上没有变化,以太网在大约一半的系统(254),InfiniBand大约三分之一的系统(182),OmniPath大约十分之一的系统(47)和Myrinet一个系统;其余使用自定义互连(38)和专有网络(6)。连接InfiniBand的系统继续在总容量中占据主导地位,而性能却超过万亿级。由于Fugaku使用专有的Tofu D互连,因此六个专有网络系统(472.9 petaflops)的总体性能几乎等于254个基于以太网的系统(477.7 petaflops)的性能。

中国继续以212台机器位居榜首,在市场占有率上领先美国,以113台机器居首,日本以34台领先。然而,尽管系统数量较少,但美国仍以668.7 petaflops的总性能位居榜首。到中国的564.0 petaflops。主要得益于排名第一的Fugaku系统,日本的总性能为593.7 petaflops,略低于中国。

绿色500 结果

绿色500 上最节能的系统是美国最新的NVIDIA DGX SuperPOD。在其2.4 HPL性能运行期间,它实现了26.2吉瓦/瓦的功率效率,并列在TOP500的第172位。

列表中的下一个是先前的Green500冠军MN-3。尽管它的得分从21.1吉比特/瓦提高到26.0吉比特/瓦,但仍跌至第二位。该系统使用MN-Core芯片,这是针对矩阵算术进行了优化的加速器。它在TOP500中排名第332位。

排在第三位的Green500是安装在德国ForschungszentrumJülich(FZJ)上的Atos制造的JUWELS Booster Module。它达到25.0 gigaflops /瓦,在TOP500中排名第七。

排在第四位的是另一架Atos制造的机器Spartan-2。它在HPL上达到24.3吉瓦/瓦,在TOP500列表中排名第148位。

绿色500 上排名第五的系统是Selene,效率为24.0 gigaflops /瓦。它还在TOP500上排名第五。

除MN-3系统外,其余排名前五的Green500系统都使用新的NVIDIA A100 GPU作为加速器。所有这四个系统均使用AMD EPYC作为其主CPU。

在Green500上排名前40位的系统中,有37个杠杆加速器,2个使用A64FX矢量处理器,一个(TaihuLight)是Sunway多核处理器。

将NVIDIA DGX SuperPOD的26.2吉比特/瓦的功率效率值线性地推算到exaflop上,将导致38 MW的功耗(忽略缩放所需的其他硬件)。

高性能CG 结果

TOP500列表包含了高性能共轭梯度(HPCG)基准测试结果,该结果为评估超级计算机性能提供了一种替代指标,旨在补充HPL测量。

领先的Fugaku以创纪录的16.0 高性能CG -petaflops扩大了其HPCG结果。在HPCG基准方面,两个美国能源部系统,分别是ORNL的Summit和LLNL的Sierra,分别排名第二和第三。萨米特(Summit)获得了2.93 高性能CG -petaflops和塞拉(Sierra)1.80 高性能CG -petaflops。打破HPCG上petaflops壁垒的唯一其他系统是升级后的Selene系统(1.62 petaflops)和新的JUWELS Booster Module(1.28 petaflops)。

HPL-AI结果

HPL-AI基准旨在通过利用利用现代硬件的新颖,混合精度算法来求解线性方程组,以强调基于机器学习和深度学习的HPC和人工智能(AI)工作负载的融合。

此基准测试中排名最高的系统是RIKEN的Fugaku系统,该系统实现了2.0 exaflops的混合精度计算。位居第二的是ORNL的Summit超级计算机,达到0.55 exaflops,其次是NVIDIA的Selene,其HPL-AI结果达到0.25 exaflops。

关于TOP500列表

1993年6月在德国举行的一次小型会议的练习开始了今天的TOP500列表的第一版。出于好奇,作者决定在1993年11月重新查看该列表,以了解情况如何变化。大约在那个时候,他们意识到自己可能会有所作为,并决定继续编制清单,这是一个备受期待,备受关注和辩论的年度活动,每年两次。

劳伦斯伯克利国家实验室的Erich Strohmaier和Horst Simon编制了TOP500列表;田纳西大学诺克斯维尔分校的杰克·东加拉(Jack Dongarra);和ISC Group的Martin Meuer。