超级计算机 :处理大量资料与高速运算的电脑

更新时间:2023-07-11 13:43

超级计算机(Supercomputer),别名高性能计算机、巨型计算机,是指一系列具有超强功能的计算机,专门为科学计算、工程应用和商业应用等需要以超快速度运算大数据量的项目而设计。通常指具有极快运算速度、极大存储容量、极高通信带宽的一类计算机。

20世纪60 年代,IBM 推出的IBM 7030 Stretch和Sperry Rand 公开的UNIVAC LARC是最早的两台超级计算机。世界上首台商业的超级计算机名叫“CDC6600”,是控制数据公司(Control 数据 Corporation)于1964年研制。超级计算机自出现以来,受各国重视,对它的研究从未中断。 2010年,“天河一号”登上全球超级计算机500强排行榜第一。2018年,美国能源部DOE的Summit登上全球超级计算机TOP500榜首。在2023年5月22日发布的全球超级计算机 500 强榜单中,美国橡树岭国家实验室(ORNL)的 Frontier 排名第一,也是地球上唯一的百亿亿次级机器。2023年12月20日,“FRONTIER”超级计算机系统入选中国工程院院刊《Engineering》评选的 “2023全球十大工程成就”。

超级计算机是一种通用算力,其设计目标是提供完备、复杂的计算能力,在高精度计算能力更强,应用范围更广,比如科学家常使用超级计算机进行行星模拟、新材料开发、分子药物设计、基因分析等科学计算和大数据处理。

发展历史

技术发展

1954年5月24日,贝尔实验室使用800只晶体管组装了世界上第一台晶体管计算机TRADIC,晶体管的发明为计算机的发展指明的方向,采用晶体管代替电子管成为第二代计算机的标志。相比电子管,晶体管体积小、重量轻、寿命长、发热少、功耗低,电子线路的结构大大改观,运算速度则大幅度提高。1958年,集成电路(IC)被发明,它将三种电子元件结合在一个小晶圆上。科学家将更多的元件集成到一个半导体芯片上。因此,计算机变得更小,耗电更少,速度更快。1964年,美国IBM公司研制成功第一个采用集成电路的通用电子计算机系列IBM360系统。1964-1971年的集成电路计算机被称为“第三代电子计算机”。1967年美国贝尔实验室制成了第一块大规模集成电路,1988年,16MB的动态随机存取存储器(DRAM)问世,一个芯片上集成了3500万个管子,标志着集成电路进入特大规模集成时代,推动了计算机技术的发展。现在的超级计算机有时也被称为并行计算机,因为超级计算机使用的是并行处理。 并行处理(Parallel Processing)是指多个 CPU 在给定时间共同对单个计算求解,计算机系统中能同时执行两个或多个处理的一种计算方法。这种算法能让超级计算机同时处理多个任务,提高运算速度。

超级计算机发展

“超级计算(Supercomputing)”这一名词在1929年《纽约世界报》关于“IBM为哥伦比亚大学建造大型报表机(tabulator)的报道”中首次出现。1943年,为解读德国TUNNY电传打字机密码,布莱切利园引入英国邮政局研究站承建的巨人计算机(Colossus)。虽然不是完全意义的图灵机,但起到决定性的作用。海军军械研究计算器(NORC),由IBM在20世纪50年代早期制造,并于1954年12月2日正式交付给美国海军。每秒能够执行15000次完整的算术运算。1958年,CDC推出了西摩·克雷设计的1604计算机,这是首批全晶体管计算机之一,CDC 1604型计算机获得了巨大的成功。

20世纪60 年代,IBM 推出了IBM 7030 Stretch,同时Sperry Rand 公开了UNIVAC LARC,这是最早的两台专门的超级计算机,其功能远远超过当时最快的商用电脑。1961年推出的IBM 7030 Stretch这款超级计算机所搭载的技术仍然被沿用至今。直到1964年,控制数据公司(Control Data Corporation)研制出了世界上首台超级计算机“CDC6600,该超级计算机是超级计算数据中心的现代鼻祖。它被认为是第一台成功的商用超级计算机。

1971年,伊利诺伊大学计并由巴勒斯建造,它安装在加利福尼亚州山景城的美国航空航天局艾姆斯研究中心。是当时使用中最快的机器的超级计算机也是第一台大型并行处理计算机。1975 年 11 月,ILLIAC IV 连接到 ARPANET (阿帕网)供分布式使用,成为首台可用的超级计算机。

1976年3月,克雷公司利用仙童公司发明的集成电路研制世界第一台具有流水结构的单向量机超级计算机“Cray-1”,运算速度每秒2.5亿次。从Cray-1诞生到80年代,Cray系列超级计算机一直盘踞在全球计算机处理速度之首。1985年,克雷公司推出的CRAY-2更是比CRAY-1功能强大了4~6倍,运行速度达到了每秒12亿次的浮点运算。

20世纪80年代初,并行处理机开始较大量地进入市场。一开始多数采用SIMD和向量机方式。截止1990年之前美国在超级计算机领域一直处于领先地位,直到1990年日本超级计算机日本电气SX-3/44R出现,超越了Cray系列,打破美国一家独大的局面。

1992年,英特尔推出了Paragon超级计算机,它是历史上第一台突破万亿次浮点计算的超级计算机。紧接着,IBM的SP2、日立制作所的SR2201和SGI公司的Origin2000超级计算机先后出现。1993年6月,曼海姆大学汉斯、埃里克等人发起全球超级计算机TOP500排名榜。它以超级计算机的持续速度(linpack实测值)为基准,每年排名两次,是全世界最具权威的超级计算机排名榜,有着“世界计算机奥林匹克”之称。

1996年12月,SGI公司研制出一台具有256个处理器的超级计算机安装在美国国家实验室。1995年,Cray T3E拥有2000多个处理器,到了90年代后,并行计算成为超级计算机主流。1996年12月11日,美国英特尔最近为美能源部开发出世界上速度最快的超级计算机,每秒可运算1.4万亿次,在超级计算机发展史上首次突破每秒万亿次大关。它可以在15秒内完成笔算需要25万年、个人计算机需要运行2天才能完成的运算任务。1997年5月11日,国际象棋世界冠军加里·卡斯帕罗夫与IBM公司的国际象棋电脑“深蓝”的六局对抗赛中,“深蓝”获得胜利。

2000年,美国能源部的技术人员使用ASCI计算机,用于模拟核武器试验。它一度是世界上运算速度最快的超级计算机,所使用的RS/6000 SP系统有每秒12万亿次计算能力,一共覆盖了9920平方英尺的建筑面积,重212600磅,需要1.2兆瓦的电力。进入2000年之后,在超级计算机领域,日本美国彼此成为最大的竞争对手。例如2003年世界前十名的超级计算机名单中,日本的“地球模拟器”排在榜首,后面全是清一色的美国产超级计算机。

2005年在巴塞罗那工业大学研制的超级计算机IBM生寒,是当时欧洲最快的超级计算机,可以使每秒40万亿次计算。截至2012年7月,SuperMuc(在嘉兴慕尼黑附近的的戈特弗里德·莱布尼茨超级计算机中心),是欧洲最快的计算机和世界上运算速度最快的计算机第四名,位于巴伐利亚州科学院。2013年中国研制的“天河二号”性能超过美国“泰坦”超级计算机近一倍,以每秒33.86千万亿次的浮点运算速度夺冠。2016年11月17日,在美国盐湖城举行的2016年全球超级计算大会上,中国科学院软件研究所的应用成果“千万核可扩展全球大气动力学全隐式模拟”获得国际高性能计算应用领域最高奖戈登贝尔奖(ACM Gordon Bell Prize),在2016年之前,美国、日本曾垄断该奖项长达近30年。

2020年11月,公布的TOP500超级计算机榜单中,日本的Fugaku(富岳)超级计算机排名第一,该系统增加了6912个节点,处理器数量达到到了7630848个,性能也有提升,Rmax值从415530提高到了创纪录的442010 TFlop/s。2022年5月30日,ISC公布了第59届的全球超算TOP500榜单,位于美国橡树岭国家实验室 (ORNL) 的新型超级计算机Frontier以绝对优势,成功超越日本的Fugaku,成为了全球首个真正的百亿亿次超级计算机。Frontier的计算设施占地 372 平方米,由 74 个 Cray EX 机柜组成,拥有 9,408 个节点,每个节点配备一个 AMD Milan “Trento” 7A53 Epyc CPU 和 四个AMD Instinct MI250X GPU(GPU核心总数达到了37,632)。在2023年发布的第 61 期超级计算机 TOP500 显示,美国橡树岭国家实验室(ORNL)的 Frontier 仍然是地球上唯一的百亿亿次级机器,其 HPL 分数已经从 2022 年 11 月的 1.02 Eflop/s 提高到 1.194 Eflop/s,增长大约 17%。2023年,超级计算机根据历年的比赛数据,对24赛季英格兰足球超级联赛排名进行了预测,预测结果是曼城继续卫冕成功,阿森纳足球俱乐部获得第二名,曼联排名第四。

排名争夺

全球排名

功能介绍

超级计算机是相对于大型计算机而言的一种运算速度更高、存储容量更大、功能更完善的计算机。超级计算机通常每秒能运算5000万次以上、存储容量超过百万个字节,性能很高。其基本组成组件与普通计算机并无太大差异,但规格与性能强大很多,具有很强的计算和处理数据的能力,主要特点表现为高速度和大容量,并且配备有丰富的、高功能的软件系统和多种外部和外围设备。普通的家用计算机由输入设备,存储器(存储器可分为 2 种,分别为主存储器和辅助存储器),CPU(中央处理器)和输出设备组成,而作为超级计算机的Frontier,它由74个专门建造的 HPE Cray EX 超级计算机机柜组成,其中包括超过9400个AMD CPU和超过37000个GPU、700 PB的数据存储空间(可提供每秒5TB的峰值写入速度)、能效液体冷却(每分钟可通过系统抽出约6000加仑的水)以及90英里(约145公里)长的网络电缆。两者的区别非常大,在性能方面有很大差异。超级计算机多被用于需要大量运算的工作,譬如天气预测、气候研究、运算化学、分子模型、物理模拟、密码分析等等。

物理模拟

超级计算机和高性能计算技术的快速发展为第一性原理计算的发展提供了机遇,使其在凝聚态物理、化学、材料和生物等研究领域发挥着越来越重要的作用。在后摩尔时代,从头算电子结构模拟成为理解现代信息技术的唯一方法。例如,中国科学技术大学入围国际戈登•贝尔奖提名的超算应用成果 “2.5 Million-Atom Ab Initio Electronic-Structure Simulation of Complex Metallic Heterostructures with DGDFT”,参加了在美国得克萨斯州达拉斯市召开的全球超级计算大会(SC22)的线上答辩,报告了中国科大在新一代神威超级计算机上采用低标度高精度第一性原理计算软件DGDFT首次实现250万原子复杂金属异质结(锂钠金属合金)的超大规模材料模拟。通过输入材料的结构信息,利用量子力学的第一性原理计算就可以较为准确地预测已知材料的基态结构和基本的物理化学性质,并实现原子级别的精准控制。这种方法不需要开展真实的实验,不仅可以极大地节省实验成本,缩短新材料的开发周期,而且可以为材料的制备和改性、新材料的开发,以及对极端环境下材料性质的研究提供有效的理论指导。

天气预报

超级计算机在观测资料的收集和分析,以及数值天气预报这两个天气预报的关键环节中起着至关重要的作用。大气观测数据来自地基和天基观测。地基观测主要包括常规气象观测站对温度、气压、湿度、风的观测,以及雷达获得的雷达回波信息。天基观测主要利用极轨卫星静止卫星获取卫星发射率信息。将纷繁复杂的观测数据按顺序整理出来,再与常规数据结合,调整到最接近真实情况的大气状态,都需要超级计算机的有力支持。2018年,美国国家气象局超级计算机能够计算8.4 petaflops(相当于每秒执行840亿次计算的能力)。到2021年底,该组织已经升级到12.1万亿次计算机。根据美国飓风中心过去二十年的统计,预测风暴路径的误差已经从2005年的100英里(160公里)下降到2020年的(104公里)。48年一遇的风暴强度预测结果在此期间也将减少20-30%的误差。

地震监测

超级计算机被应用于地震预防预测中,首先通过深度学习历史地震数据,通过人工智能地震监测系统“智能地动”可以监测到微弱地震波信号,并在两秒内报出地震参数信息。之后借助超级计算机,可以将灾害模拟评估的区域扩的更广、使精确度更高。有了超级计算机,只要输入监测到的地震数据,就能快速生成所在区域房屋破坏分布图,依托超级计算机强大的计算能力,对区域内城市群进行震害分析就会快很多。在2017年11月17日,全球超级计算大会在美国丹佛举行,由中国科研团队完成的“非线性地震模拟”再获“戈登贝尔”奖。凭借“神威·太湖之光超级计算机”的强大计算能力,中国团队成功地设计实现了高可扩展性的非线性地震模拟工具。该工具首次实现了对唐山地震发生过程的高分辨率精确模拟,对未来地震预防预测等具有重要的意义。

天文领域

虚拟宇宙实际上是一种定量的计算机模拟。通过检索模拟数据,可以获取任何时间点上的模拟星系的信息和演化过程,也可以对其进行统计上的数据分析。计算机模拟是现代宇宙学研究不可或缺的手段。橡树岭国家实验室2023年4月26日消息,在美国明尼阿波利斯市举行的美国物理学年会上,三组新宇宙学模拟代码被公布:

HACC/CRK-HACC

HACC即硬件/混合加速宇宙学代码,是一个成熟的宇宙模拟程序,主要研究暗区的大规模结构形成,包括暗能量暗物质、中微子和原始涨落的起源。它最大的目标之一是为当前的大规模、大结构形成的探查提供探查级的模拟目录,这一目标的实现必须依赖E级超算系统。

Cholla

Cholla最初由亚利桑那大学的一名博士在2014年开发,后续优化得到加速申请中心(CAAR)项目的支持,现已从纯流体动力学代码转变为天体物理学代码。Cholla最终目标是能够模拟一个银河系大小的星系,并解析单个超新星爆炸问题。到目前为止,人们只能在微小星系上实现这一点,因为分辨率要足够高才能完成整个银河系星系的模拟。这需要E级超算才能完成这项工作。

Parthenon

Parthenon由洛斯阿拉莫斯国家实验室和汉堡天文台的研究人员开发,其核心是一种基于网格模拟的自适应网格优化代码,仅在模拟网格的特定区域中优化分辨率,从而提高计算的速度和准确性。

军事领域

超级计算机在军事领域的应用,能够使作战计算精度更高、耗时更短。拿辅助指挥决策为例,从海量战场情报中获取目标信息,选择最优方案等都需要超级计算机的帮助,而且还可以大大缩短决策周期。除此之外,装备研发时需要评估其极端环境适应能力,有了超级计算机,可以大大缩短这一时间。

又例如数据分析方面,战争随着军事现代化步伐加快,发展为陆、海、空、天、电多维空间立体战争。在新的战场环境下,战场数据量爆发式增长,数据类型繁多,对数据处理能力和处理速度提出更高要求,而普通计算机的处理速度无法满足需求,但是超级计算机可以快速处理这些信息,提取作战需要的实时态势信息,辅助作战决策,有巨大作用。

在医疗方面,利用超级计算机可建立基因数据库,进而为军人建立完善的医疗档案。这样,在战场救治时,就能做到针对特定的人进行治疗,提高救治效率。

超级计算机应用于装备换代方面。例如飞行器外形是否符合空气动力学,能否充分发挥升力效能,都需要经过风洞验证,过程耗资巨大。如果采用超级计算机模拟风洞试验,就能快速得到关键技术参数,不但能加快军事装备研发速度,而且能节约研发成本。

模拟核爆炸试验,是超级计算机重要应用之一。核爆炸试验对检验、保持和提高核弹的性能,及发展新型核武器都具有非常重要的作用,但它会对环境和人类生存产生巨大影响,目前核爆炸试验的替代方式是亚临界核试验,科学家将亚临界核试验得出的数据,与以前多次核爆炸试验中搜集到的数据综合在一起,进行建模并模拟分析,得出来的结果与核爆炸试验的效果基本相同,以此进行模拟核试验。这样庞大的数据计算量只有超级计算机才能完成。美国曾利用1945年至1992年进行的1054次核爆炸试验数据,通过超级计算机建立核爆炸模型,研制新一代核弹。还可以利用超级计算机预测核武器否失效时间。

医疗领域

可以缩短药品开发时间,开发一种新的药品,通常从研制和试验需要经过很多步骤,一般需要大约15年的时间,而利用超级计算机则可以对药物研制、治疗效果和不良反应等进行模拟试验,从而将新药的研发周期缩短3~5年且可显著降低研发成本。在疫情期间,超算也发挥了重要作用,例如超算为查找、排查疑似病例等提供了有力支撑,利用超级计算机搭建的疫情大数据应急监测平台,也成功预警多起高风险地区人群输入事件,有力支持突发疫情的防范。

石油勘探

石油勘探,采用的方法是地震勘测,即在地面进行爆破后,用探测仪器检测和采集震动反射波的大量数据,通过对这些数据计算、处理和分析结果确定地下储油的位置。石油勘探中大量数值的快速计算、处理和分析,必需由高性能的超级计算机完成。地震勘探是钻前勘探油气资源的重要手段,包括地震采集、处理和解释。其中,处理这些数据,需要使用高性能超级计算机。处理的质量和地震成像的准确性和清晰度直接决定了油气资源发现的成败和勘探的成功率。

建成与维护

首先超级计算机体积巨大,因此拥有一个足够大的建设场地是建立超级计算机的第一步。同时,要建超级计算机还需要配备一个较高级别的数据机房。再者,超级计算机的能耗较大,大量的电力和水利设施也不能少,可以为超级计算机提供能源方面的支撑。例如在2019年6月发布的超级计算机TOP500榜单上,性能排名第一的Summit超算其功耗达到了10096kW。通俗点来说,就是以每小时消耗100瓦的个人电脑来做对比,其相当于十万台电脑的耗能,以交通工具来对比,其能耗约等于350公里时速行进的高铁。

在超级计算机建成后,还需进行后期维护。首先是配套设施的维护。超级计算机因为配备有大量的水力和电力设施,这些配套设施需要水电工进行定期的维护。第二是对超级计算机本身的机器维护。需要工作人员不定时对设备进行检修和清洁,还需要对设备加液以保证全浸没式液冷技术的正常工作。

每台超级计算机都有其独特的维护方式,以“乌镇之光”超级计算机为例。“乌镇之光”采用的散热方式是全浸没式液冷技术。“乌镇之光”主板上的内存、硬盘加速器等机器部件都被浸没在液体中,通过液体的冷热循环对机器进行降温。此种降温方式不仅可以提升机器的使用寿命,而且能够大幅减少机器功耗,延长机器使用寿命。

发展现状

与AI相结合

超级计算机正在不断与AI相结合,美国社交媒体Facebook母公司“元”公司正建造其首部超级计算机,可能有助于脸书利用人工智能(AI)技术管理巨量网帖。“元”公司2022年1月24日宣布名为“AI研究超级集群”的超级计算机,这部计算机将用于AI研究项目。2023年5月29日,英伟达CEO黄仁勋介绍了超级计算机DGX GH200,DGX GH200是一款大内存AI超级计算机,可用于支持生成式AI、数据处理的巨型模型。法国政府新购置一台超级计算机,除用于气候、材料和生物学等领域的研究外,还将用于人工智能研究。这台超级计算机名为HPC-IA,每秒钟可以进行1.4亿亿次的运算,这台超级计算机可以帮助研究人员优化人工智能算法,测试人工智能在某些情况下的应用极限。

亿亿级计算机

亿亿级计算机又称E级超级计算机,是每秒可进行百亿亿次数学运算的超级计算机。据《新科学人》杂志网站5月31日报道,国际超级计算组织宣布,位于美国橡树岭国家实验室的超级计算机“前沿Frontier”在2022年国际超级计算机500强榜单中获得第一名,成为当今世界上最快的超级计算机,计算能力为每秒1.1百亿亿次,是第一台每秒能够进行百亿亿次浮点运算的计算机。普通笔记本电脑每秒只能进行几万亿次运算,而前沿的超级计算机运行速度超是普通计算机的一百多万倍。因此又被称E级超级计算机。2023年12月20日,美国能源部橡树岭国家实验室与 AMD 合作建造的“FRONTIER”超级计算机系统入选中国工程院院刊《Engineering》评选的 “2023全球十大工程成就”。

π系统

超级计算机π系统23日在上海交通大学投入运行,将支持俗称“人造太阳”的惯性约束聚变项目等高端科研项目。“π”系统将主要支持上海交通大学的教学和科研,并将成为IFSA惯性约束聚变科学与应用协同创新中心超级计算的核心支撑平台。目前,惯性约束聚变(ICF)是一项世界性的科技挑战,美国日本俄罗斯欧盟都积极参与,目的是在可控范围内实现聚变,和平利用人类的终极能源——聚变能。据悉,“π”系统的峰值性能已经达到263万亿次,在最新的全球500强榜单中排名第158位。

发展前景

高性能超级计算机,自出现以来就是世界发达国家争抢的重要“制高点”,对国家安全、经济和社会发展都有着重要作用。因此加快发展超级计算机,推广超级计算机应用,对于中国科学研究、推动科技创新和促进经济社会高质量发展等多方面都有着意义重大。

先进的超算技术,不仅可以支撑重大科学领域的技术研究,也可推动新兴科技领域的创新和应用,发挥引领国家科技进步的关键作用。自超算技术出现以来,超算技术广泛应用于航天航空、电磁计算、海洋模式、医学影像、材料基因等重大科学研究和国计民生领域,为国家的基础科学研究和相关领域的技术攻关作出重要贡献。

人工智慧芯片和超级计算机是保障人工智能产业持续高速发展的核心硬件基础设施,想要发展人工智能,超算技术必不可少,且以人工智能为载体的算力更是人工智能发展水平的重要衡量指标之一,对人工智能的应用影响深远。未来,超级计算也会与容器云融合,成为新的产品。

超级计算机一直是各国竞相角逐的科技制高点,也是国家综合科技实力的体现。超级计算机主要用途包括模拟核试验、处理卫星图片、解密码等,应用领域已经覆盖了互联网大数据、工程计算、工业仿真、气象海洋、生命科学、石油物探等多种领域。在很多不能实测,只能模拟的方面,超级计算机就能够发挥作用。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}
友情链接: