HPL Benchmark ~ Top500で利用されているベンチマーク~

HPL とは、スーパーコンピューターの性能ランキングである Top500 (https://www.top500.org/)で利用されている LINPACK ベンチマーク です。HPL は、密な連立一次方程式を解いています。HPL では、ユーザーが問題の大きさを調整し、評価するマシンで最高のパフォーマンスを達成するために実行時に入力するパラメータを最適化することができます。この性能は、システムの全体的な性能を反映するものではありません。しかし、密な連立方程式を解くための専用システムの性能は反映していますし、この問題は非常に規則的であるため、達成された性能は非常に高く、性能の数値はシステムのピーク性能をよりよく反映しています。

HPL の性能は、CPU、メモリ、ネットワーク等のハードウェアだけではなく、コンパイラ、数値演算ライブラリ、MPIライブラリ等のソフトウェアも大きく影響します。したがって、ベンチマーク結果については、そのようなソフトウェアの実行環境にも注目ください。

実行結果

specification N nodes procs threads GFlops
[2024-08]
Machine : HPC-ProServer DPeR7625
CPU:(2) AMD EPYC 9354 3.25G 32C/64T
Mem : 384GB (24) 16GB RDIMM, 4800MT/s
OS : RockyLinux8.10
GPU : (1) AMD Instinct MI210
ROCm : 6.2.0
rocHPL(hpl-2.2)
Compiler :gcc 8.5.0
MPI : OpenMPI 5.0.5 (spack)
45,312 1 1 64 15,158
91,000 1 1 64 20,818
         
         
         
         
         
[2024-07]
Machine : HPC-ProServer DPeR760
CPU:(2) Intel Xeon Gold 6426Y 2.5GHz 16C/32T
Mem : Total 256GB (8) 32GB RDIMM, 4800MT/s
Network : InfiniBand HDR 200Gbps (ConnectX-6)
OS : RockyLinux 8.8
hpl-2.3
Compiler :icc version 2021.10.0
MPI : Intel MPI 2021.11
100,000 1 32 32 2,189
100,000 2 64 64 4,124
100,000 4 128 128 7,835
100,000 8 256 256 14,038
150,000 4 128 128 8,217
200,000 4 128 128 8,747
         
[2023-03]
Machine : HPC-ProServer DPeR750
CPU:(2) Intel Xeon Gold 6326 2.90GHz 16C/32T
Mem : 256GB (16) 16GB DDR4 3200MHz
OS : RockyLinux 8.7
hpl-2.3
Compiler :Intel oneAPI 2023.0.0
MPI : Intel MPI 2023.0.0
100,000 1 32 32 2,000
100,000 2 64 64 3,681
150,000 2 64 64 3,828
         
         
         
         
[2023-02]
Machine:HPC-ProServer DPeR6525 / R7525
CPU : (2) AMD EPYC 7713 2.0GHz 64C/128T (Total 128C/256T)
Mem : 512GB (16) 32GB DDR4 3200 Mhz
Network : InfiniBand HDR 200Gbps
OS : RockyLinux8.7 4.18.0-425.10.1.el8_7.x86_64
hpl-2.3
Compiler :gcc 8.5.0, OpenBLAS 0.3.21
MPI : OpenMPI 4.1.4
100,000 1 128 128 3,098
150,000 2 256 256 6,155
250,000 4 512 512 10,622
         
         
         
         
[2023-02]
Machine:HPC-ProServer DPeR650
CPU : (2) Intel Xeon Gold 6348 2.6GHz 28C/56T (Total 56C/112T)
Mem : 384GB (12) 32GB DDR4 3200MHz
OS : Alma Linux 8.6
hpl-2.3
Compiler :Intel oneAPI 2023.0.0
MKL 2023.0.0
MPI : Intel MPI 2021.8.0
100,000 1 32 32 2,038
150,000 1 32 32 2,043
150,000 1 48 48 2,582
         
         
         
         
[2023-02]
Machine:HPC-ProServer DPrT7865
CPU : (1) AMD Ryzen Threadripper PRO 5995WX
256 MB cache, 64C/128T, 2.7GHz‐4.5GHz
Mem : 256GB (8) 32GB DDR4 3200MHz
OS : Ubuntu 22.04 5.15.0-58-generic
hpl-2.3
Compiler :gcc 11.3.0 , OpenBLAS
MPI : OpenMPI 4.1.4
100,000 1 64 64 1,996
150,000 1 64 64 2,066
         
         
         
         
         
[2021-09]
Machine:HPC-ProServer DPeR6525
CPU : (2) AMD EPYC 7543 2.8GHz/3.7GHz 32C/64T
Mem : 1024GB (16) 64GB RDIMM 3200 Mhz
OS : CentOS 7.9.2009 3.10.0-1160.21.1.el7.x86_64
hpl-2.3
Compiler :AOCC 3.1.0
MPI : OpenMPI 4.1.1
100,000 1 16 64 2,287
160,000 1 16 64 2,448
200,000 1 16 64 2,458
         
         
         
         
[2020-12]
Machine:HPC-ProServer DPeR6525
CPU : (2) AMD EPYC 7402 2.8GHz/3.35GHz 24C/48T
Mem : 512GB (16) 32GB RDIMM 3200 Mhz
OS : CentOS 7.8.2003 Kernel 3.10.0-1127.18.2.el7.x86_64
hpl-2.3
Compiler :AOCC 2.3.0
MPI : OpenMPI 4.1.0 , OpenBLAS 0.3.13
100,000 1 48 48 1,919
160,000 1 48 48 1,995
200,000 1 48 48 2,017
         
         
         
         
[2019-12]
Machine:HPC-ProServer DPeR7515
CPU : (1) AMD EPYC 7702P 2.0GHz/3.4GHz 64C/128T
Mem : 256GB (8) 32GB RDIMM 3200 Mhz
OS : CentOS 7.7.1908 Kernel 3.10.0-1062.9.1.el7.x86_64
hpl-2.3
Compiler :AOCC 2.1.0 , gcc 8.3.1
MPI : OpenMPI 4.0.2 , OpenBLAS 0.3.8
100,000 1 64 64 1,552
160,000 1 64 64 1,638
         
         
         
         
         
[2018-12]
Machine:HPC-ProServer DPeR840
CPU : (4) Intel Xeon Gold 6148 2.4GHz 20C/40T (Total 80C/160T)
Mem : 1536GB (48) 32GB RDIMM 2666 Mhz
OS : CentOS 7.5.1804 Kernel 3.10.0-862.14.4
hpl-2.2
Compiler :Intel Compiler v2019.1
MPI : Intel MPI v2019.1
100,000 1 80 80 3,578
         
         
         
         
         
         
[2018-11]
Machine:HPC-ProServer DPeR740
CPU:(2) Intel Xeon Gold 6142 2.60GHz 16C/32T
Mem:96GB (12) 8GB 2666 RDIMMs
Network : InfiniBand EDR
OS:CentOS v7.4
hpl-2.2
Compiler :Intel Compiler v2019.0, MPI : Intel MPI 19.0
500,000 36 1152 1152 55,090
         
         
         
         
         
         
[2018-11]
Machine:HPC-ProServer DPeR7425
CPU:(2) AMD EPYC 7601 2.2GHz/2.7GHz 32C/64T
Mem:1024GB (32) 32GB 2133 RDIMMs
OS:CentOS v7.5
hpl-2.2
Compiler :gcc 7.3.1 , MPI : OpenMPI 3.1.3
50,000 1 16 64 1,020
100,000 1 16 64 1,119
         
         
         
         
[2018-11]
Machine:HPC-ProServer DPeR740
CPU:(2) Intel Xeon Gold 6142 2.60GHz 16C/32T
Mem:96GB (12) 8GB 2666 RDIMMs
Network : InfiniBand EDR
OS:CentOS v7.4
hpl-2.2
Compiler :Intel Compiler v2018.1, MPI : OpenMPI 3.1.2
500,000 36 1152 1152 50,370
450,000 36 1152 1152 49,840
300,000 36 1152 1152 42,540
300,000 32 1024 1024 39,110
300,000 24 768 768 30,660
300,000 16 512 512 23,560
         
[2018-03]
Machine:HPC-ProServer DPeR640
CPU:(2) Intel Xeon Gold 6142 2.60GHz 16C/32T
Mem:96GB (12) 8GB 2666 RDIMMs
Network : InfiniBand EDR
OS:CentOS v7.4
hpl-2.2
Compiler :Intel Compiler v2018.1, MPI : Intel MPI v2018.1
300,000 18 576 576 28,260
300,000 16 512 512 25,320
100,000 1 32 32 1,711
100,000 2 64 64 2,994
100,000 4 128 128 5,545
100,000 8 256 256 9,462
100,000 16 512 512 17,250
[2018-03]
Machine:HPC-ProServer DPeR740
CPU:(2) Intel Xeon Gold 6142 2.60GHz 16C/32T
Mem:96GB (12) 8GB 2666 RDIMMs
Network : InfiniBand EDR
OS:CentOS v7.4
hpl-2.2
Compiler :Intel Compiler v2018.1, MPI : OpenMPI 3.0.0
300,000 16 512 512 24,999
100,000 1 32 32 1,623
100,000 2 64 64 3,142
100,000 4 128 128 5,583
100,000 8 256 256 10,080
100,000 16 512 512 16,730
50,000 1 32 32 1,460
50,000 2 64 64 2,569
50,000 4 128 128 4,444
[2018-03]
Machine:HPC-ProServer DPeR730
CPU:(2) Intel Xeon E5-2690 v4 2.60GHz 14C/28T
Mem:64GB (8) 8GB 2400 Mhz , Network : InfiniBand FDR
OS:CentOS7.3
hpl-2.2
Compiler :Intel Compiler v2018.1, MPI : OpenMPI 3.0.0
50,000 1 28 28 886
50,000 2 56 56 1,617
50,000 4 112 112 2,856