HPC-ProServer DPeR760

第4世代 Xeon スケーラブルプロセッサ Sapphire Rapids を搭載可能な 2ソケット 2U サーバー。この世代のサーバーとしては、ハイエンドに位置する高性能サーバーです。省スペースな 2U シャーシであるにも関わらず GPU や HDD などの拡張機能を柔軟に構成可能であり、それゆえに、時代に伴って変化しつづけるサーバーに対する厳しい要求に将来にわたって応え続ける資産としての高い価値があります。最高の性能が求められる HPC (High Performance Computing) 分野や AI 、 機械学習 、ディープラーニング 、データ解析 等に最適化されたエンタープライズクラスのサーバーです。

第4世代 Xeon スケーラブル・プロセッサー ”Sapphire Rapids” 搭載

第4世代Xeonスケーラブルプロセッサは、4つのCPUダイを1つのパッケージに統合するチップレット技術を採用しており、Intelが独自開発したEMIBを利用して4つダイが1つの巨大CPUとして動作します。この技術により従来製品では最大40コアだったCPUコア数は、最大60コアへと強化されました。

3種類のダイ・パッケージ

第4世代Xeonスケーラブルプロセッサには、3種類のダイ・パッケージが存在します。4つのチップレットで構成されたXCC、1つのチップレットで構成されたMCC、及び、広帯域なHBM2eメモリを備えるインテル Xeon CPUマックス・シリーズです。インテル Xeon CPUマックス・シリーズでは、64GBのHBM2eをパッケージ上に実装し、HPCとAIのワークロードでデータ・スループットを大幅に向上させます。

新命令セット Intel AMX 搭載

Intel AMXとは、複数の行列をまとめて計算するために設計された拡張命令です。Intel AMXのアーキテクチャは、2つのコンポーネントで構成されています。

1つ目のコンポーネントはタイルです。タイルは8つの2次元レジスタで構成され、それぞれが1キロバイトの大きさです。大きなデータチャンクを格納するのデータを格納します。

2つ目のコンポーネントは「Tile Matrix Multiplication(TMUL)」で、TMULはタイルに付属するアクセラレータエンジンであり、行列の乗算計算を行います。TMULはタイルに取り付けられたアクセラレータエンジンで、AIのための行列乗算の計算を行います。

新旧Xeonの比較表
第3世代Xeonスケーラブルプロセッサ第4世代Xeonスケーラブルプロセッサ
Socket Count1 and 21S, 2S, 4S, & glueless 8S (>8S via xNC support)
Die Size10nm10nm enhanced SuperFin (Intel7)
最大コア数40コア (HT有効時 80コア) per socket60コア (HT有効時 120コア) per socket
キャッシュFirst Level Cache: 32 KB Instruction Cache 48 KB Data Cache
Mid-Level Cache: 1.25 MB private per core
Last Level Cache: 1.5 MB per core
First Level Cache: 32 KB Instruction Cache 48 KB Data Cache
Mid-Level Cache: 2 MB private per core
Last Level Cache: 1.875 MB per core
TDP最大270W最大350W
Physical/Virtual address bits52 / 5752 / 57
Memory controllers / Sub-Numa clusters4 / 2 4 / 4
MemoryUp to 8 channels DDR4 per CPU
Up to 16 DIMMs per socket
Up to 3200 MT/s 2DPC
Up to 8 channels DDR5 per CPU
Up to 4400 MT/s 2DPC
Up to 4800 MT/s 1DPC
Number of Intel® Ultra Path Interconnect (Intel® UPI) InterconnectsUp to 3 links per CPU (x20 wide)Up to 4 links per CPU (x24 wide)
Intel® UPI Interconnect SpeedUp to 11.2 GT/sUp to 16 GT/s
PCIeUp to 64 lanes per CPU (bifurcation support: x16, x8, x4)
PCIe Gen 4 support
80 PCIe lanes with Flex Bus/CXL** – per CPU
PCIe Gen 5.0 support (NTB @ PCIe 4.0)
48 lanes North/ 32 lanes South of socket
PCIe bifurcation support: x16, x8, x4, x2(Gen4)
Intel® Scalable I/O Virtualization (Intel® Scalable IOV)

ジョブ管理システムとして Altair® Grid Engine® を採用

計算機を効率よく運用するためには、信頼の置ける ジョブ管理システム が必要です。ジョブ管理システムが導入されているシステムでは、複数のユーザーが予め定められたジョブ運用ポリシーに基づき公平にジョブが実行され、システムの計算リソースが極限まで有効活用されます。

弊社では、Altair® Grid Engine® を標準ジョブ管理システムとして採用し、お客様へご利用をお勧めしています。

ジョブ管理システムに求められる信頼性

ジョブを管理するということは、ユーザーの実行するあらゆるジョブについて、ジョブ管理システムが柔軟に対応していることが必要です。ジョブの実行については、以下のようなさまざまなケースの検討が必要です。

シングルジョブシンプルなシングルジョブ
大量のシングルジョブを配列にしてスループットを向上
並列ジョブネットワークを介するMPI並列
スレッドがノード内に限定されたスレッド並列(OpenMP)
Hybrid-MPI並列 (MPIとOpenMP)
コンテナ化されたジョブDockerジョブ
Singularityジョブ
計算リソースの指定実行時間
メモリ量
GPU数
商用アプリケーションの利用可能なライセンス数
依存関係のジョブ上記のさまざまなジョブ同士の連携を設定
スケジューリングユーザーやグループ毎に使用可能な計算リソースを指定
ジョブ実行時のリソース予約

また、ジョブ管理システムでは、ジョブの運用で問題が生じた場合に、問題を検証できるだけのログを取得できることがとても重要です。Altair® Grid Engine® ではデフォルトで利用可能な稼働統計ツールも充実しており、何が原因でジョブが終了たのかを調べるための手がかりが豊富に用意されています。

サポートサービスの充実した商用ジョブ管理ソフトウェア

Altair® Grid Engine® は、商用のソフトウェアであり、問題解決のための正確なサポートが開発元から得られます。ジョブ運用の現場で発生している問題はとても複雑であり、その解決のために高度に専門的な知見が必要となる場合があります。ジョブ管理システムは、システムの運用において極めて重要な機能ですので、弊社では、サポートサービスが充実した Altair® Grid Engine® を強くお勧めしています。

HPC-ProSupportを標準装備

ジョブが動かない - 障害の通知としてはよくある典型的なお問い合わせの内容ですが、多くの原因が考えられます。正しい原因にたどり着くために、さまざまな検討が必要です。ハードウェアベンダーのサポートでは、このような障害の連絡はほぼ間違いなく門前払い的な対応になるでしょうし、ソフトウェアの問題だとしても、どのソフトウェアの問題なのか切り分けるのは困難です。OSなのか?、ジョブ管理ソフトなのか?、コンパイラなのか?、MPIなのか?そのようなときに、「ジョブが動かない」と簡単に相談いただけるのが、当社のHPC-ProSupportの保守サービスです。

仕様

プロセッサー・最大2台の第4世代インテル Xeon スケーラブル・プロセッサー・ファミリー(最大56コア、オプションでインテル® QuickAssist テクノロジー搭載)。
メモリー・32本の DDR5 DIMMスロット
・最大8 TBのRDIMMをサポート、最大速度4800 MT/s
・Registerd ECC DDR5 DIMM サポート
ストレージ
コントローラー
内蔵コントローラー(RAID):
・PERC H965i、PERC H755、PERC H755N、PERC H355、HBA355i
内部ブート:
・Boot Optimized Storage Subsystem (BOSS-N1):HWRAID 2 x M 2 NVMe SSDドライブまたはUSB
外部HBA(RAID非対応):
・HBA355e
ソフトウェアRAID:
・S160
ドライブ ベイ前面ベイ:
・最大12 x 3.5インチSAS/SATA (HDD/SSD)最大240 TB
・最大8 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大122.88 TB
・最大16 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大245.76 TB
・最大24 x 2.5インチSAS/SATA/NVMe (HDD/SSD)最大368.64 TB
背面ベイ:
・最大2 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大30.72 TB
・最大4 x 2.5インチSAS/SATA/NVMe(HDD/SSD)最大61.44 TB
電源装置・2800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
・2400 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・1800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
・1400WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・1100 WチタニウムAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・1100 W LVDC DC 48~60 V、ホット スワップ冗長
・800 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・700 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
冷却・空冷
・オプションの直接液体冷却(DLC)
ファン・標準(STD)ファン/ハイ パフォーマンス シルバー(HPR)ファン/ハイ パフォーマンス ゴールド(VHP)ファン
・最大6個のホット プラグ ファン
寸法高さ:
・86.8 mm(3.41インチ)
幅:
・482 mm(18.97インチ)
奥行き:
・772.13 mm(30.39インチ)(ベゼルを含む)
・758.29 mm(29.85インチ)(ベゼルなし)
フォーム
ファクター
2Uラック サーバー
組込型管理・iDRAC9
・iDRACダイレクト
・Redfish の iDRAC RESTful API
・iDRAC Service Module
・Quick Sync 2ワイヤレス モジュール
ベゼルLCDベゼルまたはセキュリティ ベゼル(オプション)
OpenManage・OpenManage Enterprise
・OpenManage Power Managerプラグイン
・OpenManageサービス プラグイン
・OpenManage Update Managerプラグイン
・CloudIQ for PowerEdgeプラグ イン
・OpenManage Enterprise Integration for VMware vCenter
・OpenManage Integration for Microsoft System Center
・OpenManage Integration with Windows Admin Center
モビリティーOpenManage Mobile
OpenManage
の統合
・BMC Truesight
・Microsoft System Center
・OpenManage Integration with ServiceNow
・Red Hat Ansible Modules
・Terraformプロバイダー
・VMware vCenterおよびvRealize Operations Manager
セキュリティ・暗号化形式で署名されたファームウェア
・静止データ暗号化(ローカルまたは外部キー管理を使用したSED)
・セキュア ブート
・完全消去
・セキュアなコンポーネント検証(ハードウェアの整合性チェック)
・シリコン ルート オブ トラスト
・System Lockdown(iDRAC9 EnterpriseまたはDatacenterが必要)
・TPM 2.0 FIPS、CC-TCG認証、TPM 2.0 China NationZ
ネットワーク・2 x 1 Gbe LOMカード(オプション)
・1 x OCPカード3.0(オプション)
GPU最大2 x 350 W DWまたは6 x 75 W SW
ポート前面ポート
・1 x iDRACダイレクト(Micro-AB USB)ポート
・1 x USB 2.0
・1 x VGA
背面ポート
・1 x 専用iDRAC Ethernetポート
・1 x USB 2.0
・1 x USB 3.0
・1 x シリアル(オプション)
・1 x VGA(直接液体冷却構成の場合はオプション)
内部ポート
・1 x USB 3.0(オプション)
PCIe次の最大8個のPCIeスロット
・スロット1:1 x 8 Gen5または1 x 8/1 x 16 Gen4フル ハイト、ハーフ レングスまたは1 x 16 Gen4フル ハイト、フル レングス
・スロット2:1 x 8/1 x 16 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス、または1 x 16 Gen5フル ハイト、フル レングス
・スロット3:1 x 16 Gen4ロー プロファイル、ハーフ レングス
・スロット4:1 x 8 Gen4フル ハイト、ハーフ レングス
・スロット5:1 x 8/1 x 16 Gen4フル ハイト、ハーフ レングスまたは1 x 16 Gen4フル ハイト、フル レングス
・スロット6:1 x 16 Gen4ロー プロファイル、ハーフ レングス
・スロット7:1 x 8/1 x 16 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス
・スロット7 SNAPI:1 x 16 Gen5フル ハイト、ハーフ レングス
・スロット8:1 x 8 Gen5または1 x 8 Gen4フル ハイト、ハーフ レングス
OS
Hypervisor
・Canonical Ubuntu Server LTS
・Hyper-V搭載Microsoft Windows Server
・Red Hat Enterprise Linux
・SUSE Linux Enterprise Server
・VMware ESXi