亮点-2008年6月

所有更改都是从2007年11月到2008年6月。

  • 新的第一森林舞会狮子机Roadrunner突破了petaflop的壁垒,是TOP500上最节能的森林舞会狮子机之一。

  • 四个美国DOE森林舞会狮子机主导了TOP5。

  • 英特尔在高端处理器市场上占据主导地位,占所有森林舞会狮子机的75%和基于四核的森林舞会狮子机的90%。

  • 56%的森林舞会狮子机使用四核处理器。它们的使用可加速各个级别的性能增长。

  • 排名第10的最大工业客户是法国石油公司:Total Exploration Production。

  • IBM在惠普之前捍卫了其最大的市场份额。

前十名的亮点

  • IBM在美国能源部洛斯阿拉莫斯国家实验室(LANL)建造的新型Roadrunner森林舞会狮子机打破了有史以来第一个森林舞会狮子机– 1.026 petaflop / s的petaflop / s Linpack屏障。 Roadrunner基于IBM QS22刀片服务器,该刀片服务器在Sony PlayStation 3中使用处理器的高级版本构建。这些节点与商品InfiniBand网络相连。

  • TOP10显示了六个新森林舞会狮子机和三个其他森林舞会狮子机,这些森林舞会狮子机提高了它们的测量速度。

  • 1号,2号,3号和5号森林舞会狮子机都安装在美国DOE实验室,而所有TOP5森林舞会狮子机都在美国。

  • 第二森林舞会狮子机是DOE的IBM BlueGene / L森林舞会狮子机,安装在DOE的Lawrence Livermore国家实验室(LLNL),Linpack性能为478.2 Tflop / s。

  • 第3位是该类型IBM森林舞会狮子机的较新版本的全新安装。它是美国能源部阿贡国家实验室安装的BlueGene / P森林舞会狮子机,速度达到450.3 Tflop / s。

  • 第四森林舞会狮子机安装在德克萨斯大学的德克萨斯高级计算中心(TACC)中。它是由Sun使用SunBlade x6420servers构建的,达到了326 Tflop / s的速度。这是Sun首次将森林舞会狮子机放入TOP10。

  • No. 5森林舞会狮子机是安装在DOE橡树岭国家实验室的Cray XT4森林舞会狮子机。最近对其进行了四核处理器升级,并实现了205​​ Tflop / s的Linpack性能。

  • No.6森林舞会狮子机是美国以外列表中的第一个森林舞会狮子机,并安装在德国的Forschungszentrum Juelich(FZJ)。它是IBM BlueGene / P森林舞会狮子机,测量速度为180 Tflop / s。

  • 7号森林舞会狮子机安装在新的中心,即新墨西哥州里约兰乔市的新墨西哥计算应用中心(NMCAC)。该森林舞会狮子机由SGI构建,基于Altix ICE 8200模型。测量值为133.2 Tflop / s。

  • 自11月以来,印度第二次将森林舞会狮子机安装在TOP10中。 Tata Sons Ltd.在印度浦那的全资子公司Computational Research Laboratories安装了惠普集群平台3000 BL460c森林舞会狮子机。他们将此森林舞会狮子机与自己的创新路由技术集成在一起,并获得了132.8 Tflop / s的性能,足以满足第8名的要求。

  • 第9号森林舞会狮子机是法国“信息科学技术研究所”(IDRIS)安装的新BlueGene / P森林舞会狮子机,其测量值为112.5 Tflop / s。

  • TOP10中的最后一个新森林舞会狮子机(排名第10)也是SGI Altix ICE 8200森林舞会狮子机。它是工业客户Total Total Production所安装的最大森林舞会狮子机。它基于106.1 Tflop / s的Linpack性能进行排名。

自上一版以来,世界500强的主要亮点

性能:

  • 基于四核处理器的森林舞会狮子机已经迅速占领了TOP500。已经有283个森林舞会狮子机在使用它们。 203个森林舞会狮子机使用双核处理器,只有11个森林舞会狮子机仍使用单核处理器,三个森林舞会狮子机使用IBM的具有9个核心的高级Sony PlayStation 3处理器。 Linpack基准测试可以很好地利用多核处理器,从而使性能水平提高到整个列表中的平均水平之上。

  • 列表的入门级别在Linpack基准测试中已升至9.0 Tflop / s,而六个月前为5.9 Tflop / s。

  • 仅在六个月前,该列表中的最后一个森林舞会狮子机将在上一个TOP500中列在位置200。这是TOP500项目历史16年以来最大的周转率。

  • 总的综合性能已提高到11.7 Pflop / s,而六个月前为6.97 Pflop / s,一年前为4.92 Pflop / s。

  • 排名前100位的入口点在六个月内从12.97 Tflop / s增加到18.8 Tflop / s。

  • TOP500中的平均并发级别为每个森林舞会狮子机4,850个内核,而六个月前为3,290个内核

技术:

  • 现在共有375个森林舞会狮子机(75%)正在使用英特尔处理器。这比六个月前(354个森林舞会狮子机,占70.8%)有所增加,代表了英特尔芯片在TOP500中的最大份额。

  • IBM Power处理器通过了AMD Opteron系列,现在(再次)是第二大最常见的处理器家族,拥有68个森林舞会狮子机(占13.6%),高于六个月前的61个森林舞会狮子机(占12.2%)。 56个森林舞会狮子机(占11%)使用AMD Opteron处理器,低于六个月前的78个森林舞会狮子机(占15.6%)。

  • 多核处理器是主要的芯片架构。最令人印象深刻的增长是使用英特尔Harpertown和Clovertown四核芯片的森林舞会狮子机数量,在六个月内从102个增加到253个。

  • 其余大多数森林舞会狮子机使用双核处理器。

  • 400个森林舞会狮子机被标记为集群,使其成为TOP500中最常见的体系结构,稳定占有80%的份额。

  • 千兆以太网仍然是最常用的内部森林舞会狮子机互连技术(285个森林舞会狮子机),原因是它已在工业客户中广泛使用,其次是具有120个森林舞会狮子机的InfiniBand技术。

制造商:

  • IBM和惠普继续以TOP500的所有性能水平出售大量森林舞会狮子机。

  • IBM在拥有210个森林舞会狮子机(占42%)的森林舞会狮子机上保持领先地位,而在惠普拥有183个森林舞会狮子机(占36.6%)的森林舞会狮子机方面保持领先地位。 IBM在六个月前拥有232个森林舞会狮子机(占46.4%),而惠普只有166个森林舞会狮子机(占33.2%)。

  • IBM在性能方面一直是TOP500榜单中的领先者,已安装总性能的48%(高于45%),而HP则为22.4%(低于23.9%)。

  • 在森林舞会狮子机类别中,戴尔,SGI和Cray分别紧随其后,分别为5.4%,4.4%和3.2%。

  • 在性能类别中,拥有超过5%的制造商是:Cray(占性能的6.6%),SGI(占性能的5.9%)和Dell(占性能的5.5%),它们各自都受益于TOP100中的大型森林舞会狮子机。

  • IBM(118)和HP(163)在商业和工业客户中共售出287套森林舞会狮子机中的281套,并且这个重要的市场领域显然已经陷入困境。

地理位置:

  • 美国显然是HPC森林舞会狮子机的主要消费者,在500个森林舞会狮子机中有257个。欧洲的份额(从149个森林舞会狮子机增加到184个)仍在上升,并且再次超过亚洲的份额(从58个森林舞会狮子机减少到48个)。

  • 亚洲的主要国家是日本(22个森林舞会狮子机)(从20个森林舞会狮子机增加),中国(12个森林舞会狮子机(从10个森林舞会狮子机增加)),印度(6个森林舞会狮子机(从9个森林舞会狮子机减少)和台湾的3个森林舞会狮子机(从11个森林舞会狮子机减少))。

  • 在欧洲,英国仍然是拥有53个森林舞会狮子机的第一(六个月前为48)。德国有所改进,但仍以46个森林舞会狮子机(六个月前的31个森林舞会狮子机)排名第二。

前50名的亮点

  • 进入TOP50的入门级速度为35.2 Tflop / s

  • 在TOP50中,美国拥有的森林舞会狮子机百分比与TOP500中大约相同(52%)。

  • 占主导地位的体系结构是定制构建的大规模并行森林舞会狮子机MPP,其领先优势为商品集群的40%(56%)。

  • IBM以36%的森林舞会狮子机和56%的性能领先于TOP50。

  • Cray排名第二,拥有14%的森林舞会狮子机和10.4%的性能。

  • SGI以10%的森林舞会狮子机和7.5%的性能排在第三位,紧随其后的是Dell(10%的森林舞会狮子机和4.4%的性能)。

  • 惠普在12个月前没有进入TOP50,现在拥有6%的森林舞会狮子机和5.1%的性能。

  • 60%的森林舞会狮子机安装在研究实验室,34%的安装在大学。

  • TOP50中没有使用千兆位以太网的森林舞会狮子机。

  • IBM的BlueGene是使用最多的森林舞会狮子机家族,有10个森林舞会狮子机(占20%)。

  • 英特尔处理器在38%的森林舞会狮子机中使用,领先于IBM的Power处理器(34%)和AMD(26%)。

  • 每个森林舞会狮子机的平均并发级别为24,400内核-六个月前为15,690。

超级计算机的功耗

TOP500列表也首次为许多计算森林舞会狮子机提供了功耗值,并将继续以一致的方式跟踪它们。由于“铭牌”额定功率可能比实际消耗的功率高出几倍,因此我们决定根本不报告铭牌或峰值功率额定值,而仅报告测量值。

测量:

为了保持一致性,我们要求森林舞会狮子机制造商和所有者在运行Linpack基准测试时测量功耗。可以测量整个森林舞会狮子机或森林舞会狮子机的一部分。如果仅测量森林舞会狮子机的一部分,则它必须包括所有必不可少的硬件,例如共享风扇,机柜或机架中的电源。严重依赖机房环境的组件,例如非必需磁盘,风冷机架周围的水冷套,UPS森林舞会狮子机以及类似零件,应从测量中排除。它们的功耗是计算机森林舞会狮子机使用环境的反映,而不是计算机森林舞会狮子机本身的反映。报告的测量是在节点,刀片机柜,森林舞会狮子机机架或整个森林舞会狮子机上进行的。然后将这些数据线性缩放到整个森林舞会狮子机。

功率指标:

功率效率是用于比较不同技术的流行指标。只要比较相似大小的森林舞会狮子机,它就可以用于此目的。但是,电源效率对于对单个森林舞会狮子机进行排名没有用。由于其基本性质,效率或密度不包含有关对象“大小”的信息,因此不能像TOP500那样用于按大小对森林舞会狮子机进行排名。为了进一步增加误解的可能性,Linpack性能与功耗的比率将始终将某种类型的小型森林舞会狮子机的排名比相同类型的大型森林舞会狮子机更高,这给人一种误解和误导性的印象,即小型森林舞会狮子机比大型森林舞会狮子机对超级计算更有用。森林舞会狮子机。

因此,我们决定(此时)仅列出TOP500本身中森林舞会狮子机的绝对功耗。我们目前正在考虑替代的排名方法,其中将包括多个森林舞会狮子机功能,例如性能,功耗和内存大小。

结果:

一般功率等级:

有关报告的一般功耗值的初步结果包括:

  • TOP10森林舞会狮子机的平均功耗为1.32兆瓦,平均功率效率为248 Mflop / s / Watt。

  • TOP50森林舞会狮子机的平均功耗为908千瓦,平均功率效率为193 Mflop / s / Watt。

  • TOP500森林舞会狮子机的平均功耗为257千瓦,平均功率效率为122 Mflop / s / Watt。

效率随等级降低的一种可能解释是,只有效率更高的更新森林舞会狮子机和技术才可以排在榜首。在列表的最后,新旧技术的混合降低了平均效率水平。

技术的功率效率:

TOP500中不同森林舞会狮子机的电源效率值受多种因素的影响,例如功耗,Linpack效率,并行缩放行为以及所测森林舞会狮子机的大小。考虑到这些限制,我们可以分析收集的数据并总体上发现:

  • 大多数节能超级计算机都基于:

    • IBM QS22 Cell处理器刀片高达488 Mflop / s / Watt,
    • IBM BlueGene / P森林舞会狮子机最高371 Mflop / s / Watt
  • 英特尔Harpertown四核刀片正在快速赶上:这些森林舞会狮子机已经领先于BlueGene / L(高达210 Mflop / s / Watt)。

    • 带有低功耗处理器(L5420)的IBM BladeCenter HS21,最高265 Mflop / s / Watt
    • 具有高效Linpack的SGI Altix ICE 8200EX Xeon节点(E5472)高达240 Mflop / s / Watt
    • 惠普集群平台3000 BL2x220,双密度刀片高达227 Mflop / s / Watt