首页 > 电脑 > 正文
分享到:

AI高性能:云边端硬件部署实践

时间:2022-11-08 17:56:18 来源: 智能计算芯世界 评论:0 点击:0
  第58届TOP500榜单前10名中仅有一台新系统上榜,为Voyager-EUS2。该系统是Microsoft Azure系统,排名第10位。日本超级计算机Fugaku位居榜首,其他系统排名也与上届相同,与上届相比有变化的是第5的系统Perlmutter,性能从之前的64.6Pflop/s提升至70.9Pflop/s。

  文章内容参考自“《第58届全球超级计算机TOP500排名及分析》”和“《第57届全球超级计算机TOP500排名及分析》”。

  从近2年榜单来看系统装机量各国的变化,如图2,中国的系统装机量2年内有减少趋势,最高时为55届的226台美国的装机数量本届榜单相比上一届增加了27台。美国装机总性能保持第一,且新上榜系统数量最多(32台);日本装机系统的平均性能因为Fugaku继续保持第一位。

  中国系统制造商的装机总量领先,联想居首位500台系统中有273台系统采用中国系统制造商的产品,包括了联想Lenovo(180台)、浪潮Inspur(50台)、曙光Sugon(36台)、华为Huawei(7台),其中联想装机总量排名众多厂商第一,美国的HPE居第二位,装机数量为84台。与上一届相比,中国的总装机数量有所下降(21台)。

  英特尔(Intel)继续保持TOP500处理器最大供应商地位。英特尔继续保持着TOP500处理器最大提供商,份额占比从之前的86.40%下降到81.6%;AMD处理器的占比则从9.6%上升至14.6%。在新上榜的70台系统中,配备Intel处理器的系统42台,高于配备AMD处TOP500系统保有量变化理器的数量(28台),但从总体来看,安装Intel处理器的系统数量已有半年前的459台,下滑至现今的408台。使用ARM架构处理器的系统与上届相同(5台)。

  加速卡提升总体性能,NVIDIA成主要加速部件提供商。本届榜单中151台系统使用加速部件/协处理器技术,占总份额的30.2%,比6个月前的147台略有增加。其中,84台系统使用NVIDIA  Volta芯片,43台使用NVIDIA Ampere, 8台使用NVIDIA Pasca, 共计135台。新上榜的70台系统中,25台系统采用NVIDIA 加速卡技术,最高排名为第10位的Microsoft Azure系统在TOP100中,34台系统采用了加速部件而在TOP10中,80%采用了加速卡来提升总体性能。

  高速以太网为主流互联技术,InfiniBand互联系统总性能最高。在超级计算机系统中,高速以太网是目前采用最多的互联技术,500台系统中有242台系统采用此种方式互联,占比为48.4%;而InfiniBand互联则助力更大规模超级计算系统,178台系统提供了总体性能的44.5%,且在前100名系统中,61台系统采用InfiniBand互联。

  超算正向着基于大数据、人工智能(AI)的“ 数据密集型科学”演进。近年,超算应用不再仅限于建模和计算仿真等传统的科学和工程计算业务,涌现出新的数据密集型应用,如人工智能、机器学习、大数据分析等,要求更多的HPC资源来满足日益增长的工作负载和新型用户。随着要处理的数据量的暴增,高性能计算正从以计算为核心向以数据为核心的计算演进,数据密集型超算成为未来发展的主流方向之一。近几年的戈登贝尔奖的应用趋势也彰显出,人工智能+大数据+超算的融合正成为主流趋势。

  2021年HPC  China学术年会公布了最新的国内TOP100榜单中,新增“算力服务“(以算力为资源向用户提供计算服务)领域,占据系统份额为46%,其次是超算中心占24%、人工智能应用占9%。此外,100台系统中有一批实现商业化转型的超算系统上榜,以超级云计算服务的模式向用户提供算力。

  文章小结

  本届榜单E级计算系统仍未出现,日本的Fugaku 富岳从55届上榜以来继续保持第一位。处理器和加速部件/协处理器方面仍是Intel和NVIDIA占据主要份额;约半数系统采用高速以太网互联,但InfiniBand 仍为性能高的系统采用的主要互联技术;中国保持着装机量领先的地位,中国的联想成为超级计算系统的最大供应商,美国的装机总性能保持第一,日本的平均性能为最高。新兴技术(大数据、人工智能)与传统高性能计算的融合,推动着该行业的多元化发展,从科学型(计算为主)的应用向计算+数据型应用的演进。

  下载链接:

  《服务器系列报告合集》

  1、服务器系列(1)下游需求多点开花,行业拐点即将来临

  2、服务器系列(2)从白牌崛起、品牌求变,探究云计算厂商核心需求

  如何看待ARM架构芯片在服务器端的发展前景

  集成电路技术简介

  中国电信云网融合2030技术白皮书

  《第58届全球超级计算机TOP500排名及分析》

  《第57届全球超级计算机TOP500排名及分析》

  《国海证券:元宇宙系列深度报告》

  1、元宇宙深度报告之一:下一代互联网前瞻 2、元宇宙深度报告之二:数字虚拟人赋能产业起点 3、元宇宙深度报告之三:NFT的本质思考及破圈之路

  《OCP China Day 2022资料合集(3)》

  《OCP China Day 2022资料合集(2)》

  1、突破存储边界,赋能开放计算(2022)

  2、OCP v2 & v3 Rack介绍(2022)

  3、开放整机柜简史(2022)

  4、浪潮开放网络软件创新与实践(2022)

  《OCP China Day 2022资料合集(1)》

  《主流CPU处理器合集》

  1、Intel Xeon CPU

  2、Intel IPU

  3、Intel GPU

  4、Intel Alderlake CPU

  5、IBM Telum

  6、Infineon英飞凌

  7、AMD Zen3

  8、AMD RDNA2

  9、ARM Neoverse N2

  基于IPU的云基础设施:数字业务的支点

  中国移动DPU技术白皮书(2022)

  国产高端处理器,实现CPU+DCU齐赋能

  海光:国产处理器产业领军者

  HarmonyOS 2 安全技术白皮书

  2022中国智造观察报告

  人工智能治理与可持续发展实践白皮书(2022)

  通信行业算力革命:泛在、绿色与生态(2022)

  算网一体网络架构及技术体系展望白皮书(2022)

  可信密态计算白皮书(2022)

  全球开源生态研究报告(2022年)

  1、AIPerf:大规模人工智能算力基准测试程序

  2、AI高性能:云边端硬件部署实践

  TOP10榜单情况介绍及分析

  系统Fugaku保持第一位,拥有7630848个核心,性能达到442Pflop/s,为排名第2的Summit(顶点)Linpack性能的3倍。该系统采用富士通定制的ARM A64FX处理器。

  Summit(顶点)是美国田纳西州橡树岭国家实验室(ORNL)由IBM构建系统,它仍然是美国最快的系统,在 HPL 基准测试中的性能为148.8Pflop/s,在全球排名第二。它拥有 4,356 个节点,每个节点包含两个Power9CPU,每个CPU有22个内核,六个NVIDIA Tesla V100 GPU。这些节点通过Mellanox双轨 EDR InfiniBand 网络连接在一起。

  美国加利福尼亚州劳伦斯利弗莫尔国家实验室(LINL)的  Sierra  系统排名第3。其架构与#2系统Summit非常相似。它由4,320个节点构成,具有两个Power9CPU和四个NVIDIA Tesla V100GPU。HPL性能达到了94.6Pflop/s。

  由中国国家并行计算机工程与技术研究中心(NRCPC)开发并安装在中国江苏省无锡国家超级计算中心的系统神威太湖之光以93Pflop/s排名第四。

  Perlmutter为本届TOP10中新上榜系统,该机器基于HPE Cray“ Shasta”平台,配置AMD EPYC 7763 处理器和NVIDIA A100加速部件,相比上一届性能有所提升,实现了70.9 Pflop/s的Linpack性能,依旧排名第5位。

  Selene现在排名第6,是美国NVIDIA内部安装的 NVIDIA DGX A100 SuperPOD。该系统基于AMD EPYC处理器,采用NVIDIAA100加速,MellanoxHDR InfiniBand作为网络互连,实现了63.4Pflop/s。

  由中国国防科技大学(NUDT)开发并部署在中国广州国家超级计算机中心的系统天河2A(Milky Way-2A)以61.4Pflop/s的性能排名第7,配备英特尔至强处理器和定制的Matrix-2000加速器。

  名为“ JUWELS  Booster  Module”的系统排名第8。由Atos构建的Bull  Sequana系统安装在德国的Forschungszentrum  Juelich  (FZJ)。该系统采用AMD EPYC处理器和NVIDIA A100进行加速,并使用网络,类似于Selene系统。这个系统是欧洲最强大的系统,性能达到44.1Pflop/S。

  排名第9位的HPC5是戴尔构建、意大利Eni S.p.A公司安装的PowerEdge系统,由于使用NVIDIA TeslaV100作为加速器,使用Mellanox HDR InfiniBand作为网络,实现了35.5 PFlop/s的性能。

  微软的Voyager-EUS2系统新上榜排名第10,性能为30.05Pflop/s,采用48核心的AMD EPYC处理器,配置80GB显存的NVIDIA A100 GPU加速卡和Mellanox HDR InfiniBand网络。

  榜单总体分析

  中国系统保有量再居第一,美国系统装机量上升。本届榜单500台系统中,中国的超级计算系统装机数量为173台,占34.6%,位居第一位;美国其次,系统保有量为149台,第三名为日本32台。

  EE芯视频推荐

  视频:第二届中国(上海)自贸区临港新片区半导体产业发展高峰论坛