Intel Xeon Sapphire Rapids 7960 workstation

第4世代 Intel Xeon スケーラブルプロセッサー Sapphire Rapids を搭載可能な 2 ソケット 2U ワークステーション。ワークステーションとして機能するラックマウントサーバーは、設置場所が集約されることで集中管理を可能とし、情報漏洩の防止やリソースの有効活用が可能になります。Double Wide サイズの ハイエンド GPU を最大 2 台内蔵可能であり、最高スペックのグラフィックワークステーションとして、活用することができます。

製品の特徴

・第4世代インテル Xeon スケーラブル・プロセッサー・ファミリー
・2U2ソケットラック型ワークステーション
・32 DIMM スロット (DDR5) 搭載
・ストレージ​
  3.5インチまたは2.5インチ ハード ドライブ用の8個のストレージ ベイ
・最大2台のDouble Wide サイズのGPU搭載可能
・オンサイト保守サービス: 3年 / 4年 / 5年
・以下オプション​
  対応OS : RedHat / Ubuntu​ / RockyLinux / AlmaLinux
  Altair Grid Engine
  ​インテルコンパイラ

第4世代 Xeon スケーラブル・プロセッサー ”Sapphire Rapids” 搭載

第4世代Xeonスケーラブルプロセッサは、4つのCPUダイを1つのパッケージに統合するチップレット技術を採用しており、Intelが独自開発したEMIBを利用して4つダイが1つの巨大CPUとして動作します。この技術により従来製品では最大40コアだったCPUコア数は、最大60コアへと強化されました。

3種類のダイ・パッケージ

第4世代Xeonスケーラブルプロセッサには、3種類のダイ・パッケージが存在します。4つのチップレットで構成されたXCC、1つのチップレットで構成されたMCC、及び、広帯域なHBM2eメモリを備えるインテル Xeon CPUマックス・シリーズです。インテル Xeon CPUマックス・シリーズでは、64GBのHBM2eをパッケージ上に実装し、HPCとAIのワークロードでデータ・スループットを大幅に向上させます。

新命令セット Intel AMX 搭載

Intel AMXとは、複数の行列をまとめて計算するために設計された拡張命令です。Intel AMXのアーキテクチャは、2つのコンポーネントで構成されています。

1つ目のコンポーネントはタイルです。タイルは8つの2次元レジスタで構成され、それぞれが1キロバイトの大きさです。大きなデータチャンクを格納するのデータを格納します。

2つ目のコンポーネントは「Tile Matrix Multiplication(TMUL)」で、TMULはタイルに付属するアクセラレータエンジンであり、行列の乗算計算を行います。TMULはタイルに取り付けられたアクセラレータエンジンで、AIのための行列乗算の計算を行います。

新旧Xeonの比較表
第3世代Xeonスケーラブルプロセッサ第4世代Xeonスケーラブルプロセッサ
Socket Count1 and 21S, 2S, 4S, & glueless 8S (>8S via xNC support)
Die Size10nm10nm enhanced SuperFin (Intel7)
最大コア数40コア (HT有効時 80コア) per socket60コア (HT有効時 120コア) per socket
キャッシュFirst Level Cache: 32 KB Instruction Cache 48 KB Data Cache
Mid-Level Cache: 1.25 MB private per core
Last Level Cache: 1.5 MB per core
First Level Cache: 32 KB Instruction Cache 48 KB Data Cache
Mid-Level Cache: 2 MB private per core
Last Level Cache: 1.875 MB per core
TDP最大270W最大350W
Physical/Virtual address bits52 / 5752 / 57
Memory controllers / Sub-Numa clusters4 / 2 4 / 4
MemoryUp to 8 channels DDR4 per CPU
Up to 16 DIMMs per socket
Up to 3200 MT/s 2DPC
Up to 8 channels DDR5 per CPU
Up to 4400 MT/s 2DPC
Up to 4800 MT/s 1DPC
Number of Intel® Ultra Path Interconnect (Intel® UPI) InterconnectsUp to 3 links per CPU (x20 wide)Up to 4 links per CPU (x24 wide)
Intel® UPI Interconnect SpeedUp to 11.2 GT/sUp to 16 GT/s
PCIeUp to 64 lanes per CPU (bifurcation support: x16, x8, x4)
PCIe Gen 4 support
80 PCIe lanes with Flex Bus/CXL** – per CPU
PCIe Gen 5.0 support (NTB @ PCIe 4.0)
48 lanes North/ 32 lanes South of socket
PCIe bifurcation support: x16, x8, x4, x2(Gen4)
Intel® Scalable I/O Virtualization (Intel® Scalable IOV)

シャーシの概要

(1) 前面

1. システムの正常性とシステムIDインジケーター
2. 8x DVD-ROM 9.5 mm光学ドライブ
3. 3.5インチまたは2.5インチHDD用の8個のストレージ ベイ
4. USB 2.0 ポート
5. 電源ボタン
6. VGA ポート
7. iDRACダイレクト ポート(1x Micro USB)
8. ステータスLED:ドライブ インジケーター、温度インジケーター、電気インジケーター、メモリー インジケーター、PCIeインジケーター

(2) 背面

1. PCIe拡張カード ライザー1(スロット1およびスロット2)
2. PCIe拡張カード ライザー3(スロット4およびスロット5)
3. PCIe拡張カード ライザー4(スロット7およびスロット8)
4. 電源供給ユニット(PSU2)
5. PSU2ファン
6. VGAポート:POST画面の表示用*
注:*Linux OSの場合、VGAはデフォルトで無効になっています
7. USB 3.0 ポート
8. USB 2.0 ポート
9. iDRAC9 Enterprise専用ネットワーク コネクター
10. iDRACボタン
11. PCIe拡張カード ライザー2(スロット6)
12. OCP3 NICカード(オプション)
13. PCIe拡張カード ライザー2(スロット3)
14. 2 x RJ45 Ethernetポート
15. 電源供給ユニット(PSU1)
16. PSU1ファン

ジョブ管理システムとして Altair® Grid Engine® を採用

計算機を効率よく運用するためには、信頼の置ける ジョブ管理システム が必要です。ジョブ管理システムが導入されているシステムでは、複数のユーザーが予め定められたジョブ運用ポリシーに基づき公平にジョブが実行され、システムの計算リソースが極限まで有効活用されます。

弊社では、Altair® Grid Engine® を標準ジョブ管理システムとして採用し、お客様へご利用をお勧めしています。

ジョブ管理システムに求められる信頼性

ジョブを管理するということは、ユーザーの実行するあらゆるジョブについて、ジョブ管理システムが柔軟に対応していることが必要です。ジョブの実行については、以下のようなさまざまなケースの検討が必要です。

シングルジョブシンプルなシングルジョブ
大量のシングルジョブを配列にしてスループットを向上
並列ジョブネットワークを介するMPI並列
スレッドがノード内に限定されたスレッド並列(OpenMP)
Hybrid-MPI並列 (MPIとOpenMP)
コンテナ化されたジョブDockerジョブ
Singularityジョブ
計算リソースの指定実行時間
メモリ量
GPU数
商用アプリケーションの利用可能なライセンス数
依存関係のジョブ上記のさまざまなジョブ同士の連携を設定
スケジューリングユーザーやグループ毎に使用可能な計算リソースを指定
ジョブ実行時のリソース予約

また、ジョブ管理システムでは、ジョブの運用で問題が生じた場合に、問題を検証できるだけのログを取得できることがとても重要です。Altair® Grid Engine® ではデフォルトで利用可能な稼働統計ツールも充実しており、何が原因でジョブが終了たのかを調べるための手がかりが豊富に用意されています。

サポートサービスの充実した商用ジョブ管理ソフトウェア

Altair® Grid Engine® は、商用のソフトウェアであり、問題解決のための正確なサポートが開発元から得られます。ジョブ運用の現場で発生している問題はとても複雑であり、その解決のために高度に専門的な知見が必要となる場合があります。ジョブ管理システムは、システムの運用において極めて重要な機能ですので、弊社では、サポートサービスが充実した Altair® Grid Engine® を強くお勧めしています。

HPC-ProSupportを標準装備

HPC-ProSupport は、ハードウェア・ソフトウェアを問わずユーザーの問題解決・負担軽減を目的としたサポートパッケージです。ハードウェアに加えて、OS 及びソフトウェア設定を含めて一元的なサポートサービスを提供します。複数のハードウェアベンダーで構成されることの多い計算機システムにおいて、問い合わせの一次窓口として、サポートを取りまとめる機能も備えます。ハードウェアの保守年数は最長7 年、サポートレベルは当日4 時間以内対応から翌営業日対応まで選択可能。ユーザーの運用形態に合わせて多様なサポートサービスを御提案します。

保守窓口受付時間

平日9:00~17:00
お問い合わせは、電話または電子メールの利用が可能です。
メールについては、本ホームページのメール問い合わせフォームからご連絡ください。
※年末年始及び弊社の指定する休日(夏季休暇等)は、窓口を休みにさせて頂く場合があります。

ソフトウェア、ハードウェアを問わない一貫したサポート窓口

ジョブが動かない - 障害の通知としてはよくある典型的なお問い合わせの内容ですが、原因としては多くの可能性が考えられます。正しい原因にたどり着くために、さまざまな検討が必要です。ハードウェアベンダーのサポートでは、このような障害の連絡はほぼ間違いなく門前払い的な対応になるでしょうし、ソフトウェアの問題だとしても、どのソフトウェアの問題なのか切り分けるのは極めて大変です。OSなのか?、ジョブ管理ソフトなのか?、コンパイラなのか?、MPIなのか?そのようなときに、「ジョブが動かない」と簡単に相談いただけるのが、当社のHPC-ProSupportの保守サービスです。

​障害の発生時には、ハードウェア、ソフトウェアの障害を切り分けし、必要な措置を取ります。昨今のシステムでは、単一ベンダー製品で構成されることは少なく、複数メーカーの製品で構成されたマルチベンダー環境になることが通常です。そのようなマルチベンダー環境においても、一元化されたサポート窓口を御提供します。パーツの交換が必要であれば、ハードウェアメーカーへ連絡し、お客様に代わって交換品や交換要員の手配を行います。障害の内容によっては、BIOSやファームウェア、OSのアップグレードが必要なため、そのような対応をする場合があります。弊社には、リモート保守を実施するためのリソースがあるため、それを利用しリモートから接続させて頂いて、ネットワーク越しに調査・対応させて頂く場合もあります。その他、システムの御利用方法等のQAにも対応します。

アラートメール受信サービス

障害が発生した場合に、アラートメールを自動送信する設定を行います。そのアラートメールの送信先に弊社サポートのメールアドレスを含めることで、弊社サポート担当者もアラートメールを受信致します。そのため、迅速に障害復旧の段取りに着手することができます。また、そのアラートメールには、障害の解析に必要な様々なログが添付されていますので、お客様に解析用のログを取得頂く手間を極力軽減します。

仕様:HPC-ProServer DPrR7920

CPU最大で2台 x 第4世代インテル Xeon スケーラブル・プロセッサー・ファミリー
メモリ32 DDR5 DIMMスロット
4800 MHz
・シングル プロセッサー:8個のメモリー チャネルと16個のDIMMスロットを搭載。
・デュアル プロセッサー:プロセッサーあたり8個のメモリー チャネルで、合計32個のDIMMスロットを搭載。
ストレージ コントローラーPERC H755アダプター
 信頼性、高性能、およびフォールトトレラントなディスクサブシステム管理を提供。
 RAIDレベル0、1、5、6、10、50、60のサポートを含むRAIDコントロール機能を搭載。
 Serial Attached SCSI (SAS) 3.0に準拠しており、最大12 Gb/秒のスループットを実現。
ドライブ ベイ3.5インチまたは2.5インチ ハード ドライブ用の8個のストレージ ベイ
電源装置800 Wプラチナ
1100 Wチタニウム
2400 Wプラチナ
冷却オプション空冷
寸法高さ(背面):434.00 mm
高さ(前面):482.00 mm
幅:735.00 mm
奥行き:86.80 mm
フォーム ファクター2Uラック サーバー
組み込み型管理iDRAC9
組込み NICBroadcom BCM5720 (1GbE 2port) (オプション)
ネットワーク
オプション
1 x OCP 3.0カード(オプション)
メモ:システムでは、LOMカードまたはOCPカードのいずれか、または両方をシステムにインストールすることができます。
GPUオプション最大2台のDouble Wide サイズのGPU
NVIDIA T400 LP/FH
NVIDIA T1000 LP/FH
NVIDIA Quadro GV100
NVIDIA RTX A2000
NVIDIA RTX A4000
NVIDIA RTX A4500
NVIDIA RTX A5500
NVIDIA RTX A6000
AMD Radeon W6300 LP/FH
AMD Radeon W6400 LP/FH
AMD Radeon W6600
AMD Radeon W6800
ポートUSBポート
 1 x iDRAC Directポート(前面)
 1 x USB 2.0ポート(前面)
 1 x USB 2.0ポート(背面)
 1 x USB 3.0 Gen 1ポート(背面)
ビデオポート
 1 x VGAポート(前面)
 1 x VGAポート(背面)
 専用GPUを使用
OSWindows 11 SV2
Windows 10 22H2へのWindows 11ダウングレード
Ubuntu 22.04、64ビット
Red Hat Enterprise Linux 8.6 WS