PowerEdge R960 Sapphire Rapids Intel Xeon

第4世代 Xeon スケーラブルプロセッサ Sapphire Rapids を搭載可能な 4 ソケット 2U サーバー。 DWサイズのハイエンドGPUを最大4台搭載可能です。このサーバーは、リアルタイムのビジネス及び研究ニーズを満たすように設計された強力なエンタープライズクラスのサーバーであり、高速な ハイエンド Xeon CPU と GPU を活用することで、大規模なシミュレーションやデータ解析の高速実行を実現します。

製品の特徴

・第 4 世代インテル Xeon スケーラブル・プロセッサー・ファミリー
・4 U 4 ソケットサーバー
・64 DIMM スロット ( DDR 5 ) 搭載
・ストレージ​
 前面ベイ:
  最大 8 x 2.5-inch SAS/SATA (HDD/SSD) max 122.88 TB
  最大 16 x 2.5-inch SAS/SATA (HDD/SSD) max 245.76 TB
  最大 24 x 2.5-inch NVMe (SSD) max 368.64 TB
  最大 16 x 2.5-inch SAS/SATA (HDD/SSD) + 8 x 2.5-inch NVMe (SSD) max 368.64 TB
  最大 32 x 2.5-inch SAS/SATA (HDD/SSD) max 491.52 TB)
・DWサイズのハイエンドGPUを最大4台搭載
・オンサイト保守サービス: 3年 / 4年 / 5年 / 6年 / 7年
・以下オプション​
  対応OS : RedHat / Ubuntu​ / RockyLinux / AlmaLinux
  Altair Grid Engine
  ​インテルコンパイラ

Xeon プロセッサー 4 台 + GPU 4 台による強力無比な SMP サーバー

大容量のメモリを1ノードで利用できる快適さ

2ソケットサーバーのメモリスロットが最大で32本であるのに対し、本機器では64本のスロットを備えるため、大容量のメモリを搭載することが可能です。また、大容量のメモリを実装するにあたり、高価格帯の大容量メモリモジュールではなく、安価な容量のメモリモジュールを選択できる余地があるため、大容量メモリ構成でコストパフォーマンスで有利な機器であると言えます。

大容量のメモリをMPIを利用して分散環境として利用するのではなく、シングルプロセスで利用可能であるため、計算手法に対する制約が少なく、快適にサーバーを利用することができます。

多CPU間の通信がノードの中で完結する使い勝手の良さ

MPI並列シミュレーションでは複数のメモリ領域の間で通信をしながら計算を行い、ノード内外の区別をすることなくすべての並列化作業をMPI通信によって行います。このようなプログラムを1ノードあたり複数のプロセスが配置されるような設定で実行すれば、MPI通信ライブラリが自動的にノード内およびノード間それぞれに適した方法で通信を行います。この場合、ノード内通信は高速な共有メモリを利用できるため、通信コストが低くなります。

ノード間通信は通信デバイスの選定により性能への影響が大きく、また選定するデバイスに応じてはコストも増大します。したがって、4ソケットサーバーでは、多CPU間の通信がノード内で完結することで、MPIによる並列計算の性能や安定性を向上させることができます。

サーバー台数を最小化し、管理の負担低減とインフラリソースの削減が可能に

4ソケットサーバーは、CPUを4基搭載できるため、高いパフォーマンスと大容量のストレージを提供できます。これにより、大規模なデータ分析やシミュレーション等に対応できます。また、HPC-ProServer DPeR860は、2Uの高密度設計により、ラックスペースを節約できる可能性があり、構成によっては電力や冷却のコストを削減できる可能性もあります。

さらに、サーバー台数を少なくすることで、管理や運用の負担も軽減できます。例えば、アップデートやパッチの適用、セキュリティ対策、障害対応などの作業が減ります。また、サーバー間の通信やネットワーク構成もシンプルになります。したがって、4ソケットサーバーは、サーバー台数を少なくすることで、管理が楽になる可能性があると言えます。

DWサイズのハイエンド GPU を4台搭載可能

最大4基の ダブルワイド GPU のパワーを活用できます。AI のトレーニングや推論、分析、仮想化、パフォーマンス レンダリング に至るまで、さまざまな アプリケーション を最適化することによってビジネスや研究開発を加速させることができます。

GPU , CUDA , InfiniBand , Compiler , MPI , Job Scheduler 全て実装済で納品

機械学習やHPC分野向けサーバーにおけるGPU、CUDA、InfiniBand、コンパイラ、MPIなどの実装は、確かに複雑で手間のかかる作業です。しかし、これらの実装がサーバーにワンストップで実現されることには、ユーザーにとって重要なメリットがあります。

まず第一に、これらの実装がワンストップで提供されることによって、ユーザーは時間と労力を節約できます。複数のコンポーネントを個別に実装する手間を省くことで、ユーザーは素早くシステムを構築し、プロジェクトに集中することができます。

さらに、これらの実装が整合性の取れた形で提供されることで、互いに連携し、シームレスに動作することが保証されます。異なるコンポーネント間での互換性の問題や設定の複雑さを心配する必要がなくなります。これにより、ユーザーはシステムの安定性と信頼性を高め、生産性を向上させることができます。

さらに、ワンストップでの実装によって、サポートやメンテナンスも円滑に行われます。ユーザーは1つのベンダーやサービスプロバイダーに相談するだけで、問題解決やアップデートのサポートを受けることができます。これにより、ユーザーは迅速なサポートを受けながら、システムのパフォーマンスを最大化することができます。

総括すると、これらの実装がサーバーにワンストップで実現されることは、ユーザーにとって効率的かつ簡便な解決策です。時間と労力の節約、整合性の取れたシステム、円滑なサポートとメンテナンスを通じて、ユーザーはより効果的に機械学習やHPCプロジェクトに取り組むことができます。

ジョブ管理システムとして Altair® Grid Engine® を採用

計算機を効率よく運用するためには、信頼の置ける ジョブ管理システム が必要です。ジョブ管理システムが導入されているシステムでは、複数のユーザーが予め定められたジョブ運用ポリシーに基づき公平にジョブが実行され、システムの計算リソースが極限まで有効活用されます。

弊社では、Altair® Grid Engine® を標準ジョブ管理システムとして採用し、お客様へご利用をお勧めしています。

ジョブ管理システムに求められる信頼性

ジョブを管理するということは、ユーザーの実行するあらゆるジョブについて、ジョブ管理システムが柔軟に対応していることが必要です。ジョブの実行については、以下のようなさまざまなケースの検討が必要です。

シングルジョブシンプルなシングルジョブ
大量のシングルジョブを配列にしてスループットを向上
並列ジョブネットワークを介するMPI並列
スレッドがノード内に限定されたスレッド並列(OpenMP)
Hybrid-MPI並列 (MPIとOpenMP)
コンテナ化されたジョブDockerジョブ
Singularityジョブ
計算リソースの指定実行時間
メモリ量
GPU数
商用アプリケーションの利用可能なライセンス数
依存関係のジョブ上記のさまざまなジョブ同士の連携を設定
スケジューリングユーザーやグループ毎に使用可能な計算リソースを指定
ジョブ実行時のリソース予約

また、ジョブ管理システムでは、ジョブの運用で問題が生じた場合に、問題を検証できるだけのログを取得できることがとても重要です。Altair® Grid Engine® ではデフォルトで利用可能な稼働統計ツールも充実しており、何が原因でジョブが終了たのかを調べるための手がかりが豊富に用意されています。

サポートサービスの充実した商用ジョブ管理ソフトウェア

Altair® Grid Engine® は、商用のソフトウェアであり、問題解決のための正確なサポートが開発元から得られます。ジョブ運用の現場で発生している問題はとても複雑であり、その解決のために高度に専門的な知見が必要となる場合があります。ジョブ管理システムは、システムの運用において極めて重要な機能ですので、弊社では、サポートサービスが充実した Altair® Grid Engine® を強くお勧めしています。

仕様:HPC-ProServer DPeR960

プロセッサー・最大4基の第4世代インテル Xeon スケーラブル・プロセッサー(プロセッサーごとに最大コ60コア)
メモリー・64本の DDR5 DIMMスロット
・最大16TBのRDIMMをサポート、最大速度4800 MT/s
・Registerd ECC DDR5 DIMM サポート
ストレージ
コントローラー
内蔵コントローラー:
・PPERC H965i, PERC H755, PERC H355, HBA355i
内部ブート:
・Boot Optimized Storage Subsystem (BOSS-N1):HWRAID 1, 2 x M 2 NVMe SSDドライブまたはUSB
外部HBA(RAID非対応):
・HBA355e
ドライブ ベイ前面ベイ:
・最大 8 x 2.5-inch SAS/SATA (HDD/SSD) max 122.88 TB
・最大 16 x 2.5-inch SAS/SATA (HDD/SSD) max 245.76 TB
・最大 24 x 2.5-inch NVMe (SSD) max 368.64 TB
・最大 16 x 2.5-inch SAS/SATA (HDD/SSD) + 8 x 2.5-inch NVMe (SSD) max 368.64 TB
・最大 32 x 2.5-inch SAS/SATA (HDD/SSD) max 491.52 TB)
電源装置・1100 WチタニウムAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・1400 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・1800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
・2400 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
・2800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
冷却・空冷
・水冷 Direct Liquid Cooling (DLC) ※オプション
ファン・最大6個のホットスワップ対応標準ファン
寸法高さ – 174.3 mm (6.86 inches)
幅 – 482 mm (18.97 inches)
奥行
・883.195 mm (34.77 inches) with bezel
・869.195 mm (34.22 inches) without bezel
フォーム
ファクター
4Uラック サーバー
組込型管理・iDRAC9
・iDRACダイレクト
・Redfish の iDRAC RESTful API
・iDRAC Service Module
・Quick Sync 2 wireless module
ベゼルLCDベゼルまたはセキュリティ ベゼル(オプション)
OpenManage・OpenManage Enterprise
・OpenManage Power Managerプラグイン
・OpenManageサービス プラグイン
・OpenManage Update Managerプラグイン
・CloudIQ for PowerEdgeプラグ イン
・OpenManage Enterprise Integration for VMware vCenter
・OpenManage Integration for Microsoft System Center
・OpenManage Integration with Windows Admin Center
モビリティーOpenManage Mobile
OpenManage
の統合
・BMC Truesight
・Microsoft System Center
・OpenManage Integration with ServiceNow
・Red Hat Ansible Modules
・Terraformプロバイダー
・VMware vCenterおよびvRealize Operations Manager
セキュリティ・暗号化形式で署名されたファームウェア
・静止データ暗号化(ローカルまたは外部キー管理を使用したSED)
・セキュア ブート
・完全消去
・セキュアなコンポーネント検証(ハードウェアの整合性チェック)
・シリコン ルート オブ トラスト
・System Lockdown(iDRAC9 EnterpriseまたはDatacenterが必要)
・TPM 2.0 FIPS、CC-TCG認証、TPM 2.0 China NationZ
ネットワーク・2 x 1 Gbe LOMカード ※オプション
・1 x OCPカード3.0 ※オプション
GPU最大 4 台の 400 W DWサイズ
ポート前面ポート
・1 x iDRACダイレクト(Micro-AB USB)ポート
・1 x USB 2.0
・1 x VGA
背面ポート
・1 x 専用iDRAC Ethernetポート
・1 x USB 2.0
・1 x USB 3.0
・1 x VGA ※水冷の場合はオプション
・1 x Serial ※オプション
内部ポート
・1 x USB 3.0(オプション)
PCIe最大12 x PCIe スロット:
・Slot 1: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length
・Slot 2: 1 x16 Gen5 Full height, Half length
・Slot 3: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length (double width)
・Slot 4: 1 x16 Gen5 Low profile, Half length
・Slot 5: 1 x16 Gen5 Low profile, Half length
・Slot 6: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length (double width)
・Slot 7: 1 x16 Gen5 Full height, Half length
・Slot 8: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length (double width)
・Slot 9: 1 x16 Gen5 Low profile, Half length
・Slot 10: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length
・Slot 11: 1 x16 Gen5 Full height, Half length or 1 x16 Gen5 Full height, Full length (double width)
・Slot 12: 1 x16 Gen5 Full height, Half length
OS
Hypervisor
・Canonical Ubuntu Server LTS
・Hyper-V搭載Microsoft Windows Server
・Red Hat Enterprise Linux
・SUSE Linux Enterprise Server
・VMware ESXi