美国能源部下属橡树岭国家实验室开发的Summit(顶点)以每秒14.86亿亿次的浮点运算速度再次登顶,与半年前的速度相同。美国能源部下属劳伦斯利弗莫尔国家实验室开发的Sierra(山脊)、中国超算神威·太湖之光和天河二号分列二三四位。
全球超算500强榜单每半年发布一次。本次榜单显示,中国境内有228台超算上榜,在上榜数量上蝉联第一,比半年前的榜单增加9台。美国以117台位列第二,日本、法国、德国依次位居其后。这是2017年11月以来,中国超算上榜数量连续第五次位居第一。榜单显示,中国企业继续保持上榜数量优势。联想、中科曙光和浪潮位居全球超算制造商前三位。
什么是超算
超级计算机(Super computer),顾名思义,就是具有很强的计算和处理数据能力的计算机,主要特点表现为高速度和大容量,配有多种外部和外围设备及丰富的、高功能的软件系统。一般来说,超级计算机的运算速度平均每秒1000万次以上,存贮容量在1000万位以上。
从结构上看,超级计算机和普通计算机都是大同小异的,但它将大量的处理器集中在一起以处理庞大的数据量,同时运算速度比常规计算机快许多倍,进而影响到各个行业运行,其意义十分重大。
你认为是科技强国的那些国家,就是超算的强国,这两个集合是高度重叠的。这也可以反映出超算的重要性,它相当于科技界的一种基础设施。
从半年前也就是2019年6月开始,超算TOP500的入门门槛超过1PFlops(每秒一千万亿次浮点运算),这是全球超算TOP500榜单26年以来的又一历史性突破。
超算怎么排名
TOP500是按照什么来给超算排名的?当然按照计算速度了,用专业语言来说,是每秒能够执行多少次浮点运算。
当你去看TOP500的榜单时就会发现,对于每台超算都列出了两个计算速度,一个叫做Rmax,一个叫做Rpeak。例如对于目前排第一的Summit,Rmax是每秒14.86亿亿次,Rpeak是每秒20亿亿次。
Rmax是实测的最高速度,Rpeak是理论上的最高速度。总会有些实际原因使超算的性能达不到理论上限,所以Rmax总是小于Rpeak。因此,TOP500排名用的是实测的最高速度,也就是Rmax。
超算是不是芯片越多越强悍
在中国的超算占据首席的5年中,很多人对此不屑一顾。他们以为超算就是处理器堆出来的,有钱多买些处理器,计算能力就上去了。他们还以为中国的超算都是买的外国的处理器,因此计算能力再高也不值一提。
首先,超级计算机为什么算得那么快,的确是因为超算用了很多个芯片,让它们同时执行任务,也就是高性能计算的基本法则:并行计算。
超算的单个芯片的性能跟个人电脑的芯片差不了太多,而让多个芯片进行工作,要先给它们划分好任务,这个任务划分是要消耗时间的。当各个芯片开始计算之后,还不时地要和其他芯片交换数据,数据通信,这是也是要消耗时间的。
因此,当芯片很多的时候,任务划分和数据通信会变成瓶颈因素,由此可见,芯片并不是越多越好,光靠堆芯片是堆不出超级计算机的,就跟企业越大,组织层级越多,办事效率就越低一个道理。
一台超算能够容纳下多少芯片,并不是取决于你能买到多少芯片,而是取决于系统架构。只有拥有好的系统架构,你才能拥有更多芯片,也就能拥有更大的算力,所以芯片数增加不是超算升级的原因,而是结果。除了芯片之外,架构同样也是核心技术。
那么中国超算用的是国产芯片吗
其次,来说说国产芯片的问题。TOP500上的第三和第四,也就是神威太湖之光和天河二号,它们现在用的都是国产芯——注意是现在。
神威太湖之光用的是中国自主研发的「申威26010」众核处理器。它的出现击碎了外界对于超算芯片国产化的质疑。
天河二号以前用的是英特尔的Xeon Phi(至强融核)芯片,在它连续四次夺冠后,2015年4月,美国商务部禁止英特尔公司向中国国家超级计算广州中心出售至强芯片。长沙中心、广州中心、天津中心和国防科技大学这四家国家超算中心,均被美国列入了出口管制名单。
面对来自美国的扼杀,天河二号在2017年底用国产的Matrix-2000协处理器替换了用了五年的Xeon Phi。这次升级把天河二号的每秒计算次数从3.39亿亿次提升到了6.14亿亿次,而功耗只增加了不到4%。所以六年了,天河二号还能在TOP500上排到第四,可以说相当出色。
另外还要说一句,天河二号取得突破的关键之一是中国自制的TH Express-2主干拓扑结构网络连接,这项技术世界领先。所以说,构架也是核心技术就这个道理。
当然你可能又有话要说了,那其他的超算呢?事实上,出于商业和应用上的考虑,不管是中国还是美国,大多数企业部署的超算都趋向于采用成熟的芯片,比如本期TOP500榜单中,94% 都使用了英特尔Xeon(至强)或Xeon Phi(至强融核)处理器。这是美国在计算机芯片研制方面的绝对优势,中国短时间内很难打破。
超算到底有什么用
很多人会问超算到底有什么用。回答是当然非常有用了,不然全世界的科技强国纷纷制造超算干嘛呢!
超算在情报收集、破解领域能力领先,可以强行攻破对方的安全系统,棱镜计划暴露了美国政府对公众隐私和他国公民个人数据的庞大监控,这些海量情报需要进行处理,就要用到超算。
说个离老百姓近的例子,现在的天气预报为什么总那么准,就是超算对云层进行精确的模拟和观测的结果。通过超算模拟还可以计算未来一段时间内大气污染物浓度和分布,进行空气质量报告。
而我们用到的很多先进技术——比如处理器技术、虚拟技术包括未来的量子计算,最早都是超算先用,然后才普及为民用。目前的云计算和大数据同样也需要超算的算力支持。
医疗领域,超算已经在用于肿瘤研究、DNA测序和药物研发等等。此外超算还用于核业、军事、航天等高科技领域。
总之,大到模拟宇宙的演变,小到测算一个分子结构,超算发挥作用的地方可太多了。
超算界有一个最高级荣誉——当然不是这个TOP500排名了——叫做戈登·贝尔奖(Gordon Bell Prize),是授予最杰出的高性能计算应用的,每年颁发一次。获得戈登·贝尔奖的应用,一般都在最快的超算上运行。
基于神威·太湖之光的两项应用「千万核可扩展全球大气动力学全隐式模拟」、「非线性地震模拟」分别在2016年和2017年获得戈登·贝尔奖。其中非线性地震模拟,模拟的就是唐山大地震。
中国超算什么时候能重回第一
神威太湖之光曾经在从2016年6月到2017年11月的四期TOP500榜单中排在首位,四连冠。
天河二号曾经在2013年6月至2015年10月的六期榜单中六连冠,直到2016年6月让位给神威太湖之光,然后一直保持亚军。
而美国重新夺回TOP500的第一名已经是2018年6月的事了,当时外媒铺天盖地地报道,国内也有不少人关注。
自从TOP500开始发布的1993年以来,美国曾经不止一次地失去速度最快的桂冠,但始终保持着上榜数最多的地位。到了2017年11月,中国第一次在上榜数目上登顶,美国失去这个第一。在最新的榜单中,中国扩大了上榜数目的优势,在总算力上接近美国,美国超算占比为37.1%,中国超算占比为32.3%。而半年前,这个数据是美国38.4%,中国29.9%。
从这一点看,中国超算已经相当强悍,而且继续发展下去很快会在总算力上超越美国。如果你要问中国超算什么时候拿回TOP500的第一名,机会不久就会到来,那就是世界超算格局的新变化之一:E级超算的出现。
E级超算,即百亿亿次超算,被公认为超级计算机界的下一顶皇冠。从Summit的每秒近15亿亿次浮点运算速度到百亿亿次,这中间有相当大的发展空间,到E级超算实现时,将会出现全新的榜单。
美国对此高度重视,相继宣布建造「极光」、「前沿」和「酋长岩」三台E级超算,交付时间预计为2021年至2023年。
中国也在已经开始E级超算部署三连发,其中E级超算「天河三号」原型机2018年7月已开放应用,「天河三号」有望于2020年研制成功。神威E级原型机和曙光E级原型机系统也已完成交付。
下一个第一,不出意外的话应该就在这几个名字之间诞生,我们拭目以待。
另外,大家关注第一的时候也应该清楚,科技竞争不等于战争,并没有真正意义的失败者,只要你参与竞争,就能从中获得科技进步,分享科技成就。在超算领域,我们已经是国际上数一数二的竞争者,这本身就非常了不起。而在超算的竞争中,我们同样能在高性能芯片、构架系统、软件应用等众多方面积累领先的成果,实现最终理想。
关键词: 超算