阿贡国家实验室和英特尔周四宣布,Aurora 超级计算机的 10,624 个刀片的安装已经完成,该系统将于 2023 年晚些时候上线。该机器使用数万个 Xeon Max“Sapphire Rapids”处理器,配备 HBM2E 内存以及数以万计的数据中心 GPU Max“Ponte Vecchio”计算 GPU 可实现超过 2 FP64 ExaFLOPS 的性能。
HPE 制造的 Aurora 超级计算机由 166 个机架组成,每个机架有 64 个刀片,总共 10,624 个刀片。每个 Aurora 刀片均基于两个 Xeon Max CPU(具有 64 GB 封装 HBM2E 内存)以及六个 Intel Data Center Max“Ponte Vecchio”计算 GPU。这些 CPU 和 GPU 将通过定制的液体冷却系统进行冷却。
Aurora 超级计算机总共配备了 21,248 个通用 CPU,拥有超过 110 万个高性能核心、19.9 PB 的 DDR5 内存、连接到 CPU 的 1.36 PB HBM2E 内存以及 63,744 个专为大规模并行 AI 和 HPC 工作负载而设计的计算 GPU板载 8.16 PB HBM2E 内存。这些刀片使用专为超级计算机设计的 HPE Slingshot 结构进行互连。
英特尔公司副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:“Aurora 是英特尔 Max 系列 GPU 的首次部署、最大的基于 Xeon Max CPU 的系统以及全球最大的 GPU 集群。” “我们很自豪能够成为这个历史性系统的一部分,并对 Aurora 将实现的突破性人工智能、科学和工程感到兴奋。”
Aurora超级计算机采用由1024个固态存储设备组成的存储节点阵列,提供220PB的容量以及31TB/s的总带宽,这将有助于处理涉及海量数据集的工作负载,例如核聚变研究、科学工程、物理模拟、治疗研究、天气预报和其他任务。