亮点-2020年11月

这是TOP500的第56版。

在6月份对Top10进行了改造之后,我们又看到了一些有趣的变化,它们是由两个森林舞会狮子机升级(#1 Fugaku和#5 赛琳娜 )和两个新森林舞会狮子机(#7 JUWELS增压模块和#10 达曼7 )驱动的。但是,自该项目于1993年启动以来,完整列表记录的新条目数量最少。

基于富士通定制ARM A64FX处理器的超级计算机Fugaku仍然是最新的第一号。它安装在日本神户理研计算科学中心(R-CCS)(原K计算机所在的位置)上。它由Riken和Fujitsu密切合作开发,并使用Fujitsu的Tofu D互连在节点之间传输数据。它的大小增加了大约5%,这使其HPL基准得分提高到442 Pflop / s,轻松超过了第二届Summit的3倍。

In half precision (16 bit floating point arithmetic), which are often used in machine learning and AI applications, it’s peak performance is actually above 2,000 PFlop/s (= 2 Exaflop/s) and because of 日 is, it is often introduced as 日 e first ‘Exascale’ supercomputer. Fugaku actually already demonstrated 日 is new level of performance on 日 e new HPL-AI benchmark which was measured in 2020年6月 at just over 1.4 Exaflops. It has 现在 increased its performance on 日 is new benchmark to 2 Exaflops! These are 日 e first measurements above 1 Exaflop for any precision on any type of hardware and with 日 is Fugaku is heralding 在里面 age of Exaflops! (//www.r-ccs.riken.jp/en/)

以下是Top10中森林舞会狮子机的简短摘要:

  • Fugaku仍然是第一森林舞会狮子机。它的大小从7,299,072核心略微增长到 7,630,848个内核,使它的HPL基准评分从416 Pflop / s提高 至442 Pflop / s。这使它比列表中的第二森林舞会狮子机高出3倍。

  • 首脑 ,IBM在美国橡树岭国家实验室(ORNL)建立的森林舞会狮子机 美国田纳西州仍然是美国最快的森林舞会狮子机,目前在全球排名第二 在HPL基准上的性能为148.8 Pflop / s,用于对 TOP500列表。 首脑 拥有4,356个节点,每个节点容纳两个具有22个内核的Power9 CPU 每个和六个NVIDIA Tesla V100 GPU,每个GPU具有80个流式多处理器(SM)。 节点通过Mellanox双轨EDR InfiniBand网络链接在一起。

  • 塞拉 是美国加利福尼亚劳伦斯·利弗莫尔国家实验室的一种森林舞会狮子机,目前排名第一。 3.它的架构与新的#2森林舞会狮子机Summit十分相似。它建有4,320 具有两个Power9 CPU和四个NVIDIA Tesla V100 GPU的节点。塞拉利昂取得94.6 Pflop /秒。

  • 中国国家平行研究中心开发的双威太湖光 计算机工程&技术(NRCPC)并安装在国家 中国无锡的超级计算中心'江苏省名列第 93 Pflop / s的4位。

  • 第五名的Selene是NVIDIA内部安装的NVIDIA DGX A100 SuperPOD。 美国。它在6月份被列为第七名,并且尺寸增加了一倍,因此可以向上移动 该列表由两个位置组成。该森林舞会狮子机基于带有NVIDIA的AMD EPYC处理器 A100用于加速,Mellanox HDR InfiniBand作为网络,并达到63.4 升级后的Pflops。

现场 森林舞会狮子机 核心数 最大Rmax(TFlop / s) 峰值(TFlop / s) 功率(千瓦)
1 RIKEN计算科学中心
日本
超级计算机学院 -超级计算机Fugaku,A64FX 48C 2.2GHz,豆腐互连D
富士通
7,630,848 442,010.0 537,212.0 29,899
2 DOE / SC /橡树岭国家实验室
美国
首脑 -IBM Power 森林舞会狮子机 AC922,IBM POWER9 22C 3.07GHz,NVIDIA Volta GV100,双轨Mellanox EDR Infiniband
IBM公司 公司
2,414,592 148,600.0 200,794.9 10,096
3 DOE / NNSA / LLNL
美国
塞拉 -IBM Power 森林舞会狮子机 AC922,IBM POWER9 22C 3.1GHz,NVIDIA Volta GV100,双轨Mellanox EDR Infiniband
IBM公司 公司 / NVIDIA / Mellanox
1,572,480 94,640.0 125,712.0 7,438
4 无锡国家超级计算中心
中国
双威太湖 -Sunway MPP,Sunway SW26010 260C 1.45GHz,Sunway
NRCPC
10,649,600 93,014.6 125,435.9 15,371
5 NVIDIA公司
美国
赛琳娜 -NVIDIA DGX A100,AMD EPYC 7742 64C 2.25GHz,NVIDIA A100,Mellanox HDR Infiniband
英伟达
555,520 63,460.0 79,215.0 2,646
6 广州国家超级计算机中心
中国
天河2A -TH-IVB-FEP群集,Intel Xeon E5-2692v2 12C 2.2GHz,TH Express-2,Matrix-2000
无损检测
4,981,760 61,444.5 100,678.7 18,482
7 弗里斯(FZJ)
德国
JUWELS增压模块 -Bull Sequana XH2000,AMD EPYC 7402 24C 2.8GHz,NVIDIA A100,Mellanox HDR InfiniBand / ParTec ParaStation ClusterSuite
阿托斯
449,280 44,120.0 70,980.0 1,764
8 埃尼公司
意大利
HPC5 -PowerEdge C4140,Xeon金牌6252 24C 2.1GHz,NVIDIA Tesla V100,Mellanox HDR Infiniband
戴尔EMC
669,760 35,450.0 51,720.8 2,252
9 德州高级计算中心/大学。德克萨斯州
美国
弗龙特拉 -Dell C6420,Xeon Platinum 8280 28C 2.7GHz,Mellanox InfiniBand HDR
戴尔EMC
448,448 23,516.4 38,745.9
10 沙特阿美
沙特阿拉伯
达曼7 -Cray CS-Storm,Xeon Gold 6248 20C 2.5GHz,NVIDIA Tesla V100 SXM2,InfiniBand HDR 100
慧与
672,520 22,400.0 55,423.6
  • 天河2A号(天河2A号)是由中国国立大学开发的森林舞会狮子机。 国防技术(NUDT)并部署在美国国家超级计算机中心 现在,中国光州以61.4 Pflop / s的速度排名第六。

  • 一种新的超级计算机,称为JUWELS增压模块,在该列表中排名第七。最近在Forschungszentrum J上安装了Atos制造的BullSequana机器ü巫妖(FZJ)在德国。它是模块化森林舞会狮子机体系结构的一部分,第二个基于Xeon的JUWELS模块在TOP500的位置44上单独列出。这些模块通过使用ParTec Modulo Cluster Software Suite进行集成。 Booster模块将AMD EPYC处理器与NVIDIA A100 GPU配合使用,以实现类似于第五个Selene森林舞会狮子机的加速。单独运行JUWELS增压模块能够达到44.1 HPL petaflops,这使其成为欧洲功能最强大的森林舞会狮子机。

  • 由意大利公司Eni S.p.A.安装的Dell PowerEdge森林舞会狮子机HPC5排名第8。它使用Intel Xeon Gold CPU和NVIDIA Tesla V100 GPU达到35.5 petaflops的性能。它是列表中功能最强大的森林舞会狮子机,用于客户现场的商业用途。

  • 弗龙特拉 的Dell C6420森林舞会狮子机已安装在德克萨斯州的德克萨斯高级计算中心 去年是德克萨斯大学的排名,现在排名第9位。使用 英特尔至强内核的448,448。

  • TOP10中的第二个新森林舞会狮子机是列在第10位的Dammam-7。 沙特阿拉伯的沙特阿美公司和目前的第二个商业装置 前10名。这是非常不寻常的,因为TOP10通常仅填充森林舞会狮子机 安装在政府资助的研究中心。 慧与 Cray CS-Storm森林舞会狮子机使用 NVIDIA Tesla V100用于加速和InfiniBand网络。用 HPL基准测试上的22.4 Pflop / s现在标志着TOP10的入门级。

清单中的重点

  • 列表中共有147个森林舞会狮子机正在使用加速器/协处理器技术, 六个月前为146个。 其中110个使用NVIDIA Volta 芯片,14个使用NVIDIA Pascal,以及 8个带有NVIDIA Kepler的森林舞会狮子机。

  • 英特尔继续为处理器提供最大份额(91.80%)的处理器。 TOP500森林舞会狮子机, 比六个月前的94.20%有所下降。 当前列表中有21个(4.20%)的森林舞会狮子机使用AMD处理器, 从六个月前的2.00%上升。

  • 超级计算机Fugaku保持领导地位,其次是排名第二的2个顶级DOE森林舞会狮子机Sierra和Summit 在HPCG性能方面排名第三。

  • 列表的入门级别上升到 1.32 Linpack上的Pflop / s标记 基准。

  • 最新列表中的最后一个森林舞会狮子机列在位置 463 在里面 前500强。

  • 所有500个产品的综合性能超过了Exaflop的极限 现在 2.43 exaflop / s(Eflop / s)从 2.21 exaflop / s(Eflop / s)6个月前。

  • TOP100的入口点增加到 3.15 Pflop /秒。

  • TOP500中的平均并发级别为 144,932 核心 每个森林舞会狮子机从 142,320 六个月前。

总体趋势

国家安装:

前10位HPC制造商:

十大互连技术:

十大处理器技术:

绿色500

高性能CG 结果

关于TOP500列表

今天的第一版’的TOP500列表是作为一个小型会议的练习而开始的 1993年6月在德国。出于好奇,作者决定在1993年11月重新访问该清单,以了解如何 事情变了。大约在那时,他们意识到自己可能会遇到什么,并决定继续编译 这份清单,现在是一个备受期待,备受关注和辩论的年度活动,每年两次。