GitHubで公開されているベンチマークmixbench(https://github.com/ekondis/mixbench)を使用して 半精度 (FP16), 単精度 (FP32), 倍精度 (FP64), 整数8bit (INT8) の精度別の GPU の性能評価を継続的に実施します。
- Single precision Flops (multiply-additions)
- Double precision Flops (multiply-additions)
- Half precision Flops (multiply-additions)
- Integer multiply-addition operations
実測結果 集計 ※実測結果からピークの値を抜粋
mixbench/read-only | FP16 | FP32 | FP64 | INT |
---|---|---|---|---|
GFLOPS | GFLOPS | GFLOPS | GIOPS | |
NVIDIA RTX 6000 Ada | 80,238.59 | 75,720.65 | 1,188.25 | 37,376.29 |
NVIDIA RTX 4090 | 79,668.17 | 73,406.04 | 1,085.85 | 34,803.28 |
NVIDIA A100 40G | 56,827.39 | 14,824.54 | 7,487.05 | 13,020.90 |
NVIDIA RTX 4080 | 47,506.80 | 44,588.82 | 639.76 | 20,829.41 |
AMD Instinct MI210 (HIP (AMD ROCm)) | 41,422.18 | 20,837.56 | 20,206.83 | 19,266.85 |
NVIDIA GeForce RTX 3090 | 40,761.49 | 38,698.40 | 543.73 | 17,984.60 |
AMD Instinct MI210 (OpenCL) | 40,226.22 | 20,098.06 | 19,465.33 | 18,619.78 |
NVIDIA RTX A6000 | 39,911.73 | 36,306.66 | 537.56 | 17,370.73 |
NVIDIA A40 | 36,388.94 | 34,306.09 | 489.73 | 15,979.07 |
NVIDIA GeForce RTX 2080 Ti | 30,831.05 | 15,424.95 | 413.69 | 14,479.27 |
NVIDIA RTX A5000 | 30,128.46 | 27,930.81 | 404.05 | 13,122.55 |
AMD Radeon PRO W7700 (OpenCL) | 29.961.30 | 14.458.70 | 485.23 | 3,784.74 |
AMD Radeon PRO W7700 (HIP (AMD ROCm)) | 29.731.32 | 14.820.56 | 471.50 | 3,710.51 |
AMD Radeon PRO W7700 (SYCL AdaptiveCpp) | 28,566.13 | 14,048.06 | 473.91 | 3,695.28 |
NVIDIA TITAN RTX | 24,446.77 | 12,201.22 | 326.5 | 10,754.2 |
NVIDIA GeForce RTX 2080 SUPER | 24,395.80 | 12,179.50 | 324.75 | 11,455.82 |
NVIDIA TITAN V | 23,827.05 | 11,904.82 | 5,998.90 | 10,020.40 |
AMD Radeon Vega Frontier Edition | 23,352.72 | 11,917.33 | 810.58 | 2,506.02 |
NVIDIA RTX A4000 | 22,822.16 | 17,956.03 | 305.49 | 10,029.82 |
NVIDIA GeForce RTX 2080 | 21,736.53 | 10,878.22 | 289.60 | 10,215.54 |
NVIDIA Tesla V100 PCIe 32G | 10,757.17 | 12,243.53 | 6,133.56 | 10,268.77 |
NVIDIA Tesla P100 PCIe 12G | 17,585.75 | 9,083.63 | 4,606.66 | 2,747.68 |
NVIDIA GeForce GTX 1080TI | 212.88 | 12,995.95 | 425.33 | 3,449.97 |
NVIDIA GeForce GTX 1080 | 147.21 | 9,075.68 | 294.20 | 2,326.99 |
NVIDIA GeForce GTX 1070TI | 144.88 | 8,902.09 | 289.74 | 2,136.32 |
NVIDIA Tesla k40m | N/A | 3,319.34 | 1,388.02 | 698.84 |
NVIDIA Tesla k20Xm | N/A | 3,187.65 | 1,282.44 | 611.49 |
※2024年8月7日更新
※上記の表はFP16の数値のみを基準に比較しています。
実測結果 個別結果
AMD Instinct MI210 (HIP(ROCm))
AMD Instinct MI210 (OpenCL)
NVIDIA RTX 6000 Ada
NVIDIA RTX 4090
NVIDIA RTX 4080
NVIDIA A100 40G
NVIDIA GeForce RTX 3090
NVIDIA RTX A6000
NVIDIA A40
NVIDIA TITAN RTX
NVIDIA RTX A5000
NVIDIA GeForce RTX 2080 Ti
AMD Radeon PRO W7700 (OpenCL)
AMD Radeon PRO W7700 (AMD ROCm HIP)
AMD Radeon PRO W7700 (SYCL AdaptiveCpp)
NVIDIA GeForce RTX 2080 SUPER
NVIDIA RTX A4000
NVIDIA GeForce RTX 2080
NVIDIA Tesla V100 PCIe 32G
NVIDIA TITAN V
NVIDIA Tesla P100 PCIe 12G
NVIDIA GeForce GTX 1080Ti
NVIDIA GeForce GTX 1070Ti
NVIDIA GeForce GTX 1080
NVIDIA Tesla K40m
NVIDIA Tesla K20Xm
AMD Radeon Vega Frontier Edition
※2022年8月現在、”alternating”の条件による結果の計測がサポートされなくなったので、本ページにおいても結果の表記をしていません。