2020年11月

在TOP500的第56版中,日本Fugaku超级计算机巩固了其排名第一的位置,该列表反映了平坦的性能增长曲线。尽管有两个新森林舞会狮子机成功进入前十名,但自1993年该项目开始以来,完整列表记录的新条目数量最少。

在高性能Linpack(HPL)基准上,该列表的入门级排名上升到1.32 petaflops,比2020年6月排名中记录的1.23 petaflops小幅增长。同样,所有500个森林舞会狮子机的综合性能从6月的2.22 exaflops增长到最新列表中的2.43 exaflops。同样,每个森林舞会狮子机的平均并发性几乎没有增加,从六个月前的145,363核增加到当前列表中的145,465核。

但是,前十名中有一些值得注意的发展,包括两个新森林舞会狮子机,以及排名前十的新高水位线 Fugaku超级计算机。得益于额外的硬件,Fugaku将其HPL性能提高到442 petaflops,比2020年6月首次亮相时的416 petaflops有所增加。更重要的是,Fugaku将新混合精度HPC-AI基准测试的性能提高到2.0 exaflops。 ,刷新了六个月前创下的1.4 exaflops的记录。这些代表了在任何类型的硬件上任何精度的一次exaflop以上的首次基准测试。

以下是当前十大森林舞会狮子机的简要概述:

  • Fugaku仍然位居榜首,其Arm A64FX容量从7,299,072核增加到7,630,848核。额外的硬件在HPL上实现了442 petaflops的新世界纪录。这使它比列表中的第二森林舞会狮子机高出三倍。 Fugaku由Fujitsu建造,并安装在日本神户的RIKEN计算科学中心(R-CCS)中。
  • 首脑是IBM在田纳西州橡树岭国家实验室(ORNL)建造的森林舞会狮子机,它仍然是美国最快的森林舞会狮子机,性能为148.8 petaflops。 首脑拥有4,356个节点,每个节点包含两个22核Power9 CPU和六个NVIDIA Tesla V100 GPU。
  • 塞拉是加州劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的森林舞会狮子机,其HPL标记为94.6 petaflops位居第三。它的架构与Summit的架构非常相似,每个4,320个节点都配备了两个Power9 CPU和四个NVIDIA Tesla V100 GPU。
  • 双威TaihuLight,由中国国家并行计算机工程研究中心开发的森林舞会狮子机&位于无锡国家超级计算中心的Technology(NRCPC)排名第四。它仅由Sunway SW26010处理器供电,在HPL上达到93 petaflops。
  • 排在第五位的是Selene,这是在NVIDIA Corp.内部安装的NVIDIA DGX A100 SuperPOD。它在6月被列为第七名,但尺寸增加了一倍,使其可以在列表中上移两个位置。该森林舞会狮子机基于AMD EPYC处理器和NVIDIA的新型A100 GPU进行加速。升级后,Selene在HPL上获得了63.4 petaflops。
  • 由中国国防科技大学(NUDT)开发并部署在广州的国家超级计算机中心的“天河2A”(银河2A)排名第六。它由Intel Xeon CPU和NUDT的Matrix-2000 DSP加速器提供动力,在HPL上达到61.4 petaflops。
  • 一种新的超级计算机,称为JUWELS增压模块,在该列表中排名第七。 阿托斯制造的BullSequana机器最近安装在德国的ForschungszentrumJülich(FZJ)。它是模块化森林舞会狮子机体系结构的一部分,第二个基于Xeon的JUWELS模块在TOP500的位置44上单独列出。这些模块通过使用ParTec Modulo Cluster Software Suite进行集成。 Booster模块将AMD EPYC处理器与NVIDIA A100 GPU配合使用,以实现类似于第五个Selene森林舞会狮子机的加速。单独运行JUWELS增压模块可以达到44.1 HPL petaflops,这使其成为欧洲功能最强大的森林舞会狮子机

  • 由意大利公司Eni S.p.A.安装的Dell PowerEdge森林舞会狮子机HPC5排名第8。它使用Intel Xeon Gold CPU和NVIDIA Tesla V100 GPU达到35.5 petaflops的性能。它是列表中功能最强大的森林舞会狮子机,用于客户现场的商业用途。
  • 弗龙特拉是去年在德克萨斯大学的德克萨斯高级计算中心安装的Dell C6420森林舞会狮子机,现在排名第九。它使用448,448个Intel Platinum Xeon内核实现了23.5 petaflops。
  • 列表顶部的第二个新森林舞会狮子机是Dammam-7,排名第10。它安装在沙特阿拉伯的沙特阿美(Saudi Aramco)上,是目前排名前10位中的第二台商用超级计算机。HPE Cray CS-Storm森林舞会狮子机使用Intel Gold Xeon CPU和NVIDIA Tesla V100 GPU。在HPL基准测试中达到22.4 petaflops。

 

 

前10个网站

有关列表中站点和森林舞会狮子机的更多信息,请单击链接或查看 完整清单.

森林舞会狮子机 核心数 最大Rmax(TFlop / s) 峰值(TFlop / s) 功率(千瓦)
1 超级计算机学院 -超级计算机Fugaku,A64FX 48C 2.2GHz,豆腐互连D, 富士通
RIKEN计算科学中心
日本
7,630,848 442,010.0 537,212.0 29,899
2 首脑 -IBM Power 森林舞会狮子机 AC922,IBM POWER9 22C 3.07GHz,NVIDIA Volta GV100,双轨Mellanox EDR Infiniband, IBM公司
DOE / SC /橡树岭国家实验室
美国
2,414,592 148,600.0 200,794.9 10,096
3 塞拉 -IBM Power 森林舞会狮子机 AC922,IBM POWER9 22C 3.1GHz,NVIDIA Volta GV100,双轨Mellanox EDR Infiniband, IBM公司 / NVIDIA / Mellanox
DOE / NNSA / LLNL
美国
1,572,480 94,640.0 125,712.0 7,438
4 双威太湖 -Sunway MPP,Sunway SW26010 260C 1.45GHz,Sunway, NRCPC
无锡国家超级计算中心
中国
10,649,600 93,014.6 125,435.9 15,371
5 赛琳娜 -NVIDIA DGX A100,AMD EPYC 7742 64C 2.25GHz,NVIDIA A100,Mellanox HDR Infiniband, 英伟达
NVIDIA公司
美国
555,520 63,460.0 79,215.0 2,646
6 天河2A -TH-IVB-FEP群集,Intel Xeon E5-2692v2 12C 2.2GHz,TH Express-2,Matrix-2000, 无损检测
广州国家超级计算机中心
中国
4,981,760 61,444.5 100,678.7 18,482
7 JUWELS增压模块 -Bull Sequana XH2000,AMD EPYC 7402 24C 2.8GHz,NVIDIA A100,Mellanox HDR InfiniBand / ParTec ParaStation ClusterSuite, 阿托斯
弗里斯(FZJ)
德国
449,280 44,120.0 70,980.0 1,764
8 HPC5 -PowerEdge C4140,Xeon Gold 6252 24C 2.1GHz,NVIDIA Tesla V100,Mellanox HDR Infiniband, 戴尔EMC
埃尼公司
意大利
669,760 35,450.0 51,720.8 2,252
9 弗龙特拉 -Dell C6420,Xeon Platinum 8280 28C 2.7GHz,Mellanox InfiniBand HDR, 戴尔EMC
德州高级计算中心/大学。德克萨斯州
美国
448,448 23,516.4 38,745.9
10 达曼7 -Cray CS-Storm,Xeon Gold 6248 20C 2.5GHz,NVIDIA Tesla V100 SXM2,InfiniBand HDR 100, 慧与
沙特阿美
沙特阿拉伯
672,520 22,400.0 55,423.6