第4世代 Xeon スケーラブルプロセッサ Sapphire Rapids を搭載可能な 2ソケット 2U サーバー。この世代のサーバーとしては、ハイエンドに位置する高性能サーバーです。省スペースな 2U シャーシであるにも関わらず GPU や HDD などの拡張機能を柔軟に構成可能であり、それゆえに、時代に伴って変化しつづけるサーバーに対する厳しい要求に将来にわたって応え続ける資産としての高い価値があります。最高の性能が求められる HPC (High Performance Computing) 分野や AI 、 機械学習 、ディープラーニング 、データ解析 等に最適化されたエンタープライズクラスのサーバーです。
第4世代 Xeon スケーラブル・プロセッサー ”Sapphire Rapids” 搭載
第4世代Xeonスケーラブルプロセッサは、4つのCPUダイを1つのパッケージに統合するチップレット技術を採用しており、Intelが独自開発したEMIBを利用して4つダイが1つの巨大CPUとして動作します。この技術により従来製品では最大40コアだったCPUコア数は、最大60コアへと強化されました。
3種類のダイ・パッケージ
第4世代Xeonスケーラブルプロセッサには、3種類のダイ・パッケージが存在します。4つのチップレットで構成されたXCC、1つのチップレットで構成されたMCC、及び、広帯域なHBM2eメモリを備えるインテル Xeon CPUマックス・シリーズです。インテル Xeon CPUマックス・シリーズでは、64GBのHBM2eをパッケージ上に実装し、HPCとAIのワークロードでデータ・スループットを大幅に向上させます。
新命令セット Intel AMX 搭載
Intel AMXとは、複数の行列をまとめて計算するために設計された拡張命令です。Intel AMXのアーキテクチャは、2つのコンポーネントで構成されています。
1つ目のコンポーネントはタイルです。タイルは8つの2次元レジスタで構成され、それぞれが1キロバイトの大きさです。大きなデータチャンクを格納するのデータを格納します。
2つ目のコンポーネントは「Tile Matrix Multiplication(TMUL)」で、TMULはタイルに付属するアクセラレータエンジンであり、行列の乗算計算を行います。TMULはタイルに取り付けられたアクセラレータエンジンで、AIのための行列乗算の計算を行います。
新旧Xeonの比較表
第3世代Xeonスケーラブルプロセッサ | 第4世代Xeonスケーラブルプロセッサ | |
Socket Count | 1 and 2 | 1S, 2S, 4S, & glueless 8S (>8S via xNC support) |
Die Size | 10nm | 10nm enhanced SuperFin (Intel7) |
最大コア数 | 40コア (HT有効時 80コア) per socket | 60コア (HT有効時 120コア) per socket |
キャッシュ | First Level Cache: 32 KB Instruction Cache 48 KB Data Cache Mid-Level Cache: 1.25 MB private per core Last Level Cache: 1.5 MB per core | First Level Cache: 32 KB Instruction Cache 48 KB Data Cache Mid-Level Cache: 2 MB private per core Last Level Cache: 1.875 MB per core |
TDP | 最大270W | 最大350W |
Physical/Virtual address bits | 52 / 57 | 52 / 57 |
Memory controllers / Sub-Numa clusters | 4 / 2 | 4 / 4 |
Memory | Up to 8 channels DDR4 per CPU Up to 16 DIMMs per socket Up to 3200 MT/s 2DPC | Up to 8 channels DDR5 per CPU Up to 4400 MT/s 2DPC Up to 4800 MT/s 1DPC |
Number of Intel® Ultra Path Interconnect (Intel® UPI) Interconnects | Up to 3 links per CPU (x20 wide) | Up to 4 links per CPU (x24 wide) |
Intel® UPI Interconnect Speed | Up to 11.2 GT/s | Up to 16 GT/s |
PCIe | Up to 64 lanes per CPU (bifurcation support: x16, x8, x4) PCIe Gen 4 support | 80 PCIe lanes with Flex Bus/CXL** – per CPU PCIe Gen 5.0 support (NTB @ PCIe 4.0) 48 lanes North/ 32 lanes South of socket PCIe bifurcation support: x16, x8, x4, x2(Gen4) Intel® Scalable I/O Virtualization (Intel® Scalable IOV) |
ジョブ管理システムとして Altair® Grid Engine® を採用
計算機を効率よく運用するためには、信頼の置ける ジョブ管理システム が必要です。ジョブ管理システムが導入されているシステムでは、複数のユーザーが予め定められたジョブ運用ポリシーに基づき公平にジョブが実行され、システムの計算リソースが極限まで有効活用されます。
弊社では、Altair® Grid Engine® を標準ジョブ管理システムとして採用し、お客様へご利用をお勧めしています。
ジョブ管理システムに求められる信頼性
ジョブを管理するということは、ユーザーの実行するあらゆるジョブについて、ジョブ管理システムが柔軟に対応していることが必要です。ジョブの実行については、以下のようなさまざまなケースの検討が必要です。
シングルジョブ | シンプルなシングルジョブ 大量のシングルジョブを配列にしてスループットを向上 |
並列ジョブ | ネットワークを介するMPI並列 スレッドがノード内に限定されたスレッド並列(OpenMP) Hybrid-MPI並列 (MPIとOpenMP) |
コンテナ化されたジョブ | Dockerジョブ Singularityジョブ |
計算リソースの指定 | 実行時間 メモリ量 GPU数 商用アプリケーションの利用可能なライセンス数 |
依存関係のジョブ | 上記のさまざまなジョブ同士の連携を設定 |
スケジューリング | ユーザーやグループ毎に使用可能な計算リソースを指定 ジョブ実行時のリソース予約 |
また、ジョブ管理システムでは、ジョブの運用で問題が生じた場合に、問題を検証できるだけのログを取得できることがとても重要です。Altair® Grid Engine® ではデフォルトで利用可能な稼働統計ツールも充実しており、何が原因でジョブが終了たのかを調べるための手がかりが豊富に用意されています。
サポートサービスの充実した商用ジョブ管理ソフトウェア
Altair® Grid Engine® は、商用のソフトウェアであり、問題解決のための正確なサポートが開発元から得られます。ジョブ運用の現場で発生している問題はとても複雑であり、その解決のために高度に専門的な知見が必要となる場合があります。ジョブ管理システムは、システムの運用において極めて重要な機能ですので、弊社では、サポートサービスが充実した Altair® Grid Engine® を強くお勧めしています。
HPC-ProSupportを標準装備
ジョブが動かない - 障害の通知としてはよくある典型的なお問い合わせの内容ですが、多くの原因が考えられます。正しい原因にたどり着くために、さまざまな検討が必要です。ハードウェアベンダーのサポートでは、このような障害の連絡はほぼ間違いなく門前払い的な対応になるでしょうし、ソフトウェアの問題だとしても、どのソフトウェアの問題なのか切り分けるのは困難です。OSなのか?、ジョブ管理ソフトなのか?、コンパイラなのか?、MPIなのか?そのようなときに、「ジョブが動かない」と簡単に相談いただけるのが、当社のHPC-ProSupportの保守サービスです。
仕様
プロセッサー | ・最大2台の第4世代インテル Xeon スケーラブル・プロセッサー・ファミリー(最大56コア、オプションでインテル® QuickAssist テクノロジー搭載)。 |
メモリー | ・32本の DDR5 DIMMスロット ・最大8 TBのRDIMMをサポート、最大速度4800 MT/s ・Registerd ECC DDR5 DIMM サポート |
ストレージ コントローラー | 内蔵コントローラー(RAID): ・PERC H965i、PERC H755、PERC H755N、PERC H355、HBA355i 内部ブート: ・Boot Optimized Storage Subsystem (BOSS-N1):HWRAID 2 x M 2 NVMe SSDドライブまたはUSB 外部HBA(RAID非対応): ・HBA355e ソフトウェアRAID: ・S160 |
ドライブ ベイ | 前面ベイ: ・最大12 x 3.5インチSAS/SATA (HDD/SSD)最大240 TB ・最大8 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大122.88 TB ・最大16 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大245.76 TB ・最大24 x 2.5インチSAS/SATA/NVMe (HDD/SSD)最大368.64 TB 背面ベイ: ・最大2 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大30.72 TB ・最大4 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大61.44 TB |
電源装置 | ・2800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長 ・2400 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長 ・1800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長 ・1400WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長 ・1100 WチタニウムAC 100~240 Vまたは240 HVDC、ホット スワップ冗長 ・1100 W LVDC DC 48~60 V、ホット スワップ冗長 ・800 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長 ・700 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長 |
冷却 | ・空冷 ・オプションの直接液体冷却(DLC) |
ファン | ・標準(STD)ファン/ハイ パフォーマンス シルバー(HPR)ファン/ハイ パフォーマンス ゴールド(VHP)ファン ・最大6個のホット プラグ ファン |
寸法 | 高さ: ・86.8 mm(3.41インチ) 幅: ・482 mm(18.97インチ) 奥行き: ・772.13 mm(30.39インチ)(ベゼルを含む) ・758.29 mm(29.85インチ)(ベゼルなし) |
フォーム ファクター | 2Uラック サーバー |
組込型管理 | ・iDRAC9 ・iDRACダイレクト ・Redfish の iDRAC RESTful API ・iDRAC Service Module ・Quick Sync 2ワイヤレス モジュール |
ベゼル | LCDベゼルまたはセキュリティ ベゼル(オプション) |
OpenManage | ・OpenManage Enterprise ・OpenManage Power Managerプラグイン ・OpenManageサービス プラグイン ・OpenManage Update Managerプラグイン ・CloudIQ for PowerEdgeプラグ イン ・OpenManage Enterprise Integration for VMware vCenter ・OpenManage Integration for Microsoft System Center ・OpenManage Integration with Windows Admin Center |
モビリティー | OpenManage Mobile |
OpenManage の統合 | ・BMC Truesight ・Microsoft System Center ・OpenManage Integration with ServiceNow ・Red Hat Ansible Modules ・Terraformプロバイダー ・VMware vCenterおよびvRealize Operations Manager |
セキュリティ | ・暗号化形式で署名されたファームウェア ・静止データ暗号化(ローカルまたは外部キー管理を使用したSED) ・セキュア ブート ・完全消去 ・セキュアなコンポーネント検証(ハードウェアの整合性チェック) ・シリコン ルート オブ トラスト ・System Lockdown(iDRAC9 EnterpriseまたはDatacenterが必要) ・TPM 2.0 FIPS、CC-TCG認証、TPM 2.0 China NationZ |
ネットワーク | ・2 x 1 Gbe LOMカード(オプション) ・1 x OCPカード3.0(オプション) |
GPU | 最大2 x 350 W DWまたは6 x 75 W SW |
ポート | 前面ポート ・1 x iDRACダイレクト(Micro-AB USB)ポート ・1 x USB 2.0 ・1 x VGA 背面ポート ・1 x 専用iDRAC Ethernetポート ・1 x USB 2.0 ・1 x USB 3.0 ・1 x シリアル(オプション) ・1 x VGA(直接液体冷却構成の場合はオプション) 内部ポート ・1 x USB 3.0(オプション) |
PCIe | 次の最大8個のPCIeスロット ・スロット1:1 x 8 Gen5または1 x 8/1 x 16 Gen4フル ハイト、ハーフ レングスまたは1 x 16 Gen4フル ハイト、フル レングス ・スロット2:1 x 8/1 x 16 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス、または1 x 16 Gen5フル ハイト、フル レングス ・スロット3:1 x 16 Gen4ロー プロファイル、ハーフ レングス ・スロット4:1 x 8 Gen4フル ハイト、ハーフ レングス ・スロット5:1 x 8/1 x 16 Gen4フル ハイト、ハーフ レングスまたは1 x 16 Gen4フル ハイト、フル レングス ・スロット6:1 x 16 Gen4ロー プロファイル、ハーフ レングス ・スロット7:1 x 8/1 x 16 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス ・スロット7 SNAPI:1 x 16 Gen5フル ハイト、ハーフ レングス ・スロット8:1 x 8 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス |
OS Hypervisor | ・Canonical Ubuntu Server LTS ・Hyper-V搭載Microsoft Windows Server ・Red Hat Enterprise Linux ・SUSE Linux Enterprise Server ・VMware ESXi |