亮点-2018年6月

TL; DR

  • Summit是IBM在美国田纳西州橡树岭国家实验室(ORNL)建造的系统,以122.3 petaflop / s(Pflop / s)的性能排名第一。 Sierra是美国加州劳伦斯·利弗莫尔国家实验室(Lawrence Livermore National Laboratory)的非常相似的系统,排名第3。这两个系统在HPCG基准测试中也占据了前两个位置。
  • 由于Summit和Sierra的影响,美国以HPC性能的使用者居于领先地位,其安装量占整体安装量的38.2%,而中国以29.1%的安装量排名第二。
  • 领先的HPC制造商有史以来第一次不是美国公司。联想以23.8%的安装系统领先。其次是HPE(占15.8%),Inspur(占13.6%),Cray(占11.2%)和Sugon(占11%)。

前十名的亮点

  • 在一段时间以来,顶级产品几乎没有变化,与去年11月相比,新TOP500的前五个系统中有四个是全新的或经过了大幅升级。
  • 在一年未入围前三名之后,美国凭借两套新系统获得了第一名和第三名。目前在中国安装的顶级系统排名第二和第四,在日本排名第一的系统排名第五,在欧洲安装的第一系统现在排名第六。
  • Summit是IBM在美国田纳西州橡树岭国家实验室(ORNL)上构建的系统,在HPL基准测试中以122.3 Pflop / s的性能名列第一,用于排名TOP500。 Summit拥有4,356个节点,每个节点包含两个Power9 CPU(每个CPU具有22个内核)和六个NVIDIA Tesla V100 GPU(每个GPU具有80个流式多处理器(SM))。节点通过Mellanox双轨EDR InfiniBand网络连接在一起。
  • 双威TaihuLight,由中国国家并行计算机工程研究中心开发的系统&该技术(NRCPC)安装在中国江苏省无锡国家超级计算机中心,在过去的两年中一直处于领先地位,但以93 Pflop / s的速度被推至第二名。它是TOP 5中唯一的系统,自上次列出以来,该系统不是新的也不是升级的。
  • Sierra是美国加利福尼亚州劳伦斯·利弗莫尔国家实验室的新系统,排名第3。它的架构与新的#1系统峰会非常相似。它由4,320个节点构成,带有两个Power9 CPU和四个NVIDIA Tesla V100 GPU。 Sierra达到了71.6 Pflop / s。
  • 天河2A(银河系2A)是由中国国防科技大学(NUDT)开发并部署在中国光州国家超级计算机中心的系统,通过使用新的专有Matrix-2000芯片替代了至强PHI加速器进行了升级。现在是61.4 Pflop / s的第四系统。
  • 新的AI桥接云基础架构(ABCI)安装在日本国家先进工业科学技术研究院(AIST)上,并以19.88 Pflop / s的速度列为第5名。富士通的构建系统正在使用具有20个内核的Xeon Gold处理器以及NVIDIA Tesla V100。
  • 排名第六的是Piz Daint,这是Cray XC50系统,安装在瑞士卢加诺的瑞士国家超级计算中心(CSCS)上,并且是欧洲功能最强大的系统。该系统总共有361,760个内核。
  • Titan是在能源部(DOE)橡树岭国家实验室安装的Cray XK7系统,以前是美国最大的系统,现在是第七系统。它使用261,632个NVIDIA K20x加速器内核达到了17.59 Pflop / s。
  • 美国国家能源部劳伦斯·利弗莫尔国家实验室安装的IBM BlueGene / Q系统红杉是第八号系统。它于2011年首次交付,使用1,572,864个内核已达到17.17 Pflop / s。
  • 由Los Alamos国家实验室和Sandia国家实验室操作并位于Los Alamos的Trinity Cray XC40系统具有940,800个内核,达到了14.1 Pflop / s的速度,这使其排名第9。
  • Cori是Cray XC40超级计算机,由1,630个Intel Xeon“ Haswell”处理器节点,9,300个Intel Xeon Phi 7250(“骑士登陆”)节点组成,于2016年11月进入TOP500,目前以622,336个内核的14.01 Pflops / s排名第10。 。

总体清单中的重点

  • 美国的系统数量继续从六个月前的145个进一步下降至124个新低。
  • 中国的已安装系统数量保持在创纪录的水平,目前为206个,而上一个列表中为202个。中国保留的装置数量远远超过美国。
  • 美国的确在表现类别上从中国夺回了领先优势。美国安装的系统现在占整体安装性能的38.2%,而中国排名第二,占整体安装性能的29.1%。与六个月前相比,这些数字是相反的。
  • 有273个系统,占列表总数的一半以上,性能比列表中的Pflops / s高,而六个月前为181个。
  • 在前十名中,排名第一的系统,Summit,第三的Sierra和第五的ABCI使用NVIDIA Volta GPU来实现其性能。排名第六的系统Piz Daint和排名第七的系统Titan正在使用其他NVIDIA GPU来加速计算。
  • 加速器用于110种TOP500系统中,与2017年11月列表中的101种加速系统相比略有增加。这些系统中有98种存在NVIDIA GPU,其中包括前10名中的5种:Summit,Sierra,ABCI,Piz Daint和Titan。七个系统配备了至强融核协处理器。 PEZY加速器用于四个系统。 Matrix-2000协处理器用于单台计算机上,即升级后的Tianhe-2A。另外20个系统使用至强融核作为主要处理单元。
  • 这110个系统的加速器内核平均数量为145,200个内核/系统。
  • 英特尔继续为TOP500系统提供最大份额(95.0%)的处理器。
  • 97.8%的系统使用具有八个或更多核心的主处理器,82.4%的使用十二个或更多核心的主处理器,以及53.2%的16个或更多核心的主处理器。
  • 我们将HPCG基准测试结果纳入了Top500列表中,以更加平衡地评估性能。
  • 在ORNL的两个新的DOE系统峰会和在LLNL的Sierra峰会也夺得了HPCG基准的前两个职位。 Summit达到了2.93 高性能CG-Pflop / s和Sierra 1.80 高性能CG-Pflop / s。紧随其后的是上一届的领导者富士通的K计算机,该计算机在总体TOP500中排名第16。

自第50版以来TOP500的主要亮点

  • 列表的入门级别在Linpack基准测试中已升至716 Tflop / s,而六个月前为548 Tflop / s。
  • 最新列表中的最后一个系统在上一个TOP500中的位置372处列出。该营业额与过去四年的情况相符,但远低于以前的水平。
  • 与六个月前的845 Pflop / s和一年前的749 Pflop / s相比,所有500个系统的总综合性能首次超过Exaflop障碍,现在为1.22 exaflop / s(Eflop / s)。安装性能的提高远低于我们直到2013年所看到的以前的长期趋势。
  • TOP100的入口点在六个月内从1.28 Pflop / s增长到1.71 Pflop / s。
  • TOP500中的平均并发级别为每个系统116,100个内核,低于六个月前的138,000个内核,但高于一年前的96,160个内核。这种下降是由于ExaScaler Gyoukou系统的退市引起的,该系统上次创下了近2000万个内核的记录。

供应商趋势

  • 现在共有476个系统(占95.2%)正在使用Intel处理器,比六个月前的94.2%略有增加。
  • IBM Power处理器的份额现在为13个系统,低于六个月前的14个系统。
  • 现在,在247个系统中使用了10G以太网(或更快的速度)(以前是228个)。现在,在139个系统中发现了InfiniBand技术,低于163个系统,它是内部使用率第二高的内部系统互连技术。
  • 英特尔Omni-Path技术目前已应用于38个系统,而六个月前为35个系统。
  • 领先的HPC制造商第一次不是来自美国。联想以23.8%的安装系统领先。其次是HPE(占15.8%),Inspur(占13.6%),Cray(占11.2%)和Sugon(占11%)。
  • 联想从六个月前的81系统增加到119系统,HPE从122系统减少到79。浪潮从56系统增加到68。
  • Cray现在拥有56个系统,数量与过去几年相当。
  • Sugon在列表中包含55个系统,而之前是51个。  
  • IBM紧随其后的是19个系统。

业绩趋势

  • IBM在性能方面领先制造商。由于使用了Summit和Sierra系统,IBM现在贡献了该列表中所有性能的19.9%。
  • Cray在总安装性能中所占份额为16.5%(低于19.5%)。
  • 联想现在以9.1%的性能增长12.0%,位居第三。
  • HPE紧随其后,为9.9%,低于六个月前的15.2%。
  • 由于采用了Sunway TaihuLight系统,NRCPC以总性能的7.7%(从11.1%的水平下降)保持了第五名。

地理观测

  • 中国仍然是HPC系统的主要消费者,拥有206个系统(从201个增加),超过美国的124个系统(从143个减少)。欧洲的份额(101个系统,从上一个列表中的93个增加)明显低于亚洲的261个系统,比六个月前的252个有所增加。
  • 亚洲的主要国家是中国的206个系统和日本的36个系统(之前是35个)。  
  • 在欧洲,英国增加到22个系统,德国保持在21个系统,其次是法国,增加到18个系统。  

绿色500

  • The data collection and curation of the 绿色500 project has been integrated with the TOP500 project. This allows submissions of all data through a single webpage at  http://repetplas.com/submit
  • 绿色500的前3名均由日本安装的系统占据。
  • 前3个系统基于ZettaScaler-2.2架构,而前10名中的所有其他系统均使用NVIDIA GPU。
  • 能源效率最高的系统(也是Green500上的第一名)再次是Shoubu系统B,它是日本RIKEN计算与通信高级中心的ZettaScaler-2.2系统。经过重新测量,在其858 Tflop / s Linpack性能运行期间达到了18.4 GFlops / Watt的功率效率。它在TOP500中的位置362上列出。
  • 绿色500中排名第二的是日本高能加速器研究组织/ KEK的Suiren2系统。该ZettaScaler-2.2系统达到了16.8 GFlops / Watt。它在TOP500中的位置421上列出。
  • Sakura系统在Green500中排在第三位,该系统安装了日本PEZY Computing K.K.系统的制造商。它达到了16.7 GFlops /瓦。它在TOP500中的位置388上列出。
  • 排名第四的是DGX SaturnV Volta系统,这是美国NVIDIA安装的NVIDIA系统。它实现了15.1 GFlops / Watt的电源效率。它在TOP500中的位置228上。
  • 第五位是安装在橡树岭国家实验室的Summit。它达到了13.88 GFlops / Watt的电源效率。它位于TOP500的位置1。
  • 第六名是由TSUBAME 3.0系统在日本东京工业大学的GSIC中心获得的。它使用NVIDIA GPU达到13.6 Glops / Watt的电源效率。
  • 随后是AIST AI云系统,AI桥接云基础架构(ABCI)系统,新的IBM系统MareNostrum P9(西班牙),Summit(美国),Wilkes-2(英国),它们都还使用各种NVIDIA GPU。 。

高性能CG结果

  • 现在,Top 500列表包括高性能共轭梯度(HPCG)基准测试结果。
  • 在ORNL的两个新的DOE系统峰会和在LLNL的Sierra峰会在HPCG基准测试中排名前2位。 Summit达到了2.93 高性能CG-Pflop / s和Sierra 1.80 高性能CG-Pflop / s。
  • 紧随其后的是上一届的领导者富士通的K计算机,该计算机在总体TOP500中排名第16。

关于TOP500列表

1993年6月在德国举行的一次小型会议的练习开始了今天的TOP500列表的第一版。出于好奇,作者决定在1993年11月重新查看该列表,以了解情况如何变化。大约在那个时候,他们意识到自己可能会有所作为,并决定继续编制清单,这是一个备受期待,备受关注和辩论的一年两次的活动。

劳伦斯伯克利国家实验室的Erich Strohmaier和Horst Simon编制了TOP500列表;田纳西大学诺克斯维尔分校的杰克·东加拉(Jack Dongarra);和ISC Group的Martin Meuer。