AMD EPYC 9004 Series Genoa R6615

第4世代 AMD EPYC 9004シリーズ Genoa 搭載。1Uのシャーシに最大1ソケット96CPUコア/192スレッドの処理能力を備え、科学技術計算 ( HPC ) 及び大規模なデータ解析の用途に最適なサーバーです。液冷にも対応し、効率的な冷却と騒音の低減、ラック密度の向上に大きな効果をもたらします。

製品の特徴

・第4世代 AMD EPYC プロセッサー 搭載
・1U1ソケットサーバー
・12 DIMM スロット (DDR5) 搭載
・ストレージ​
 前面ベイ:
  最大4台の3.5インチSAS/SATA (HDD/SSD)最大80 TB
  最大8台の2.5インチNVMe (SSD)最大122.88 TB
  最大10台の2.5インチSAS/SATA/NVMe (HDD/SSD)最大153.6 TB
 背面ベイ:
  最大2台の2.5インチSAS/SATA (HDD/SSD)最大30.72 TB
・オンサイト保守サービス: 3年 / 4年 / 5年 / 6年 / 7年
・以下オプション​
  対応OS : RedHat / Ubuntu​ / RockyLinux / AlmaLinux
  Altair Grid Engine
  ​インテルコンパイラ

第4世代 AMD EPYC プロセッサー搭載 9004シリーズ

AMD EPYC

AMD EPYC 9004 シリーズは、AMD が開発したサーバー向けのプロセッサーで、コードネームは”Genoa”と呼ばれています。このプロセッサーは、AMD の Zen 4 アーキテクチャを採用しており、最大 96 コア 192 スレッドをサポートしています。また、DDR5メモリー と PCIe 5.0 インターフェースをサポートしており、高速なデータ転送が可能です。さらに、より効率的な電力管理が可能で、省エネルギー化の面でも優れています。AMD EPYC 9004シリーズは、今後の大規模なクラウドサービスやデータセンターにおいて、高い処理能力と信頼性を発揮することが期待されています。

 

AMD EPYC 9004シリーズの特徴

  1. 最新のAMD Zen4アーキテクチャ
    • AMD EPYC 9004シリーズは、最新のAMD Zen4アーキテクチャを採用しています。このアーキテクチャは、前世代のZen3に比べて大幅に改善された性能を持ち、より高速に処理が行えます。
    • AVX-512命令に対応しています。256bit SIMDレジスタを利用して演算するため、512bit AVX命令を実行するには2クロックサイクルかかる計算になり、スループットは256bit時と変わりませんが、命令を解釈するフロントエンドの効率などが改善され性能が向上しています。また、VNNIなどのAVX-512の拡張追加命令にも対応しています。
    • VNNI(Vectorized Neural Network Instruction)は、Intelが開発した、人工知能分野で利用される深層学習の演算を高速化するための命令セットです。VNNIは、AVX-512を基にしており、CPUに組み込まれたAVX-512ユニットを使って高速な演算を実現します。
    • bfloat16(Brain Floating Point Format)に対応しています。bfloat16は、16ビットのビット幅を持ち、深層学習におけるニューラルネットワークの高速な処理を実現するために開発されました。浮動小数点演算を高速に行うため、既存の半精度フォーマットであるfloat16やfloat32よりも高速な演算が可能です。bfloat16は、float16と同様に16ビットのビット幅を持っていますが、仮数部を7ビットに制限しながら、指数部は8ビット(float16の指数部は5ビット)を使用します。これにより、bfloat16は精度を犠牲にしながら、演算を高速化することができます
  2. 最大96コアの多数のコアを搭載
    • AMD EPYC 9004シリーズは、最大96コアの多数のコアを搭載しています。このため、多数のアプリケーションを同時に処理することが可能であり、高いパフォーマンスを発揮します。
  3. 5nmプロセス技術を採用
    • AMD EPYC 9004シリーズは、5nmプロセス技術を採用することで、従来のCPUに比べて消費電力を大幅に削減し、高い効率性を発揮します。
  4. PCI Express 5.0およびDDR5メモリに対応しており、高速なデータ転送とメモリ容量の増加に対応
    • DDR5メモリはDDR4メモリに比べて、理論的には転送速度が2倍になり、最大6,400 MT/sのデータ転送速度を実現することができます。これにより、より速いアプリケーションの読み込みや処理が可能になります。尚、DDR5転送速度は、9004シリーズリリース時は4800 MT/sとなります。これは、前世代のDDR4-3200と比較して、1.5倍の性能となります。
    • 1P構成で最大128レーン、2P構成で最大160レーンのPCIe Gen 5レーンを搭載しています。さらに、「ボーナス」レーンとして、2ソケット構成では最大12本、シングルソケット構成では最大8レーン構成されます。

直接液体冷却に対応し、効率的な冷却と騒音の低減、ラック密度の向上を実現

(1) ライザーを搭載したシステムの内部

AMD EPYC 9004 series Genoa R6615 internal
1. 冷却ファン ケージ アセンブリー
2. ファン電源コネクター
3. プロセッサー
4. ライザー モジュールを取り付けるラッチ メカニズム
5. ライザー モジュールをガイドするためのガイド メカニズム
6. ライザー 3
7. 電源供給ユニット(PSU 1および2)
8. システム ボード
9. ライザー 2
10. ラッチ付きドライブ バックプレーン
11. 情報タグ

(2) ライザー+背面2 x 2.5インチ モジュールを搭載したシステムの内部

AMD EPYC 9004 series Genoa R6615 internal
1. 冷却ファン ケージ アセンブリー
2. ファン電源コネクター
3. プロセッサー
4. ライザー モジュールを取り付けるラッチ メカニズム
5. ライザー モジュールをガイドするためのガイド メカニズム
6. ライザー 3
7. 電源供給ユニット(PSU 1および2)
8. 2 x 2.5インチ背面ドライブ
9. ライザー 2
10. ラッチ付きドライブ バックプレーン
11. 情報タグ

(3) 直接液体冷却を搭載したシステムの内部

AMD EPYC 9004 series Genoa R6615 internal
1. 冷却ファン ケージ アセンブリー
2. ファン電源コネクター
3. 液体冷却モジュール
4. システム ボード
5. クーラント チューブ
6. クーラント チューブ/センサー ケーブル ホルダー
7. 電源供給ユニット(PSU 1および2)
8. LOMカード
9. OCPカード
10. コイン型バッテリー
11. ラッチ付きドライブ バックプレーン
12. 情報タグ

ジョブ管理システムとして Altair® Grid Engine® を採用

計算機を効率よく運用するためには、信頼の置ける ジョブ管理システム が必要です。ジョブ管理システムが導入されているシステムでは、複数のユーザーが予め定められたジョブ運用ポリシーに基づき公平にジョブが実行され、システムの計算リソースが極限まで有効活用されます。

弊社では、Altair® Grid Engine® を標準ジョブ管理システムとして採用し、お客様へご利用をお勧めしています。

ジョブ管理システムに求められる信頼性

ジョブを管理するということは、ユーザーの実行するあらゆるジョブについて、ジョブ管理システムが柔軟に対応していることが必要です。ジョブの実行については、以下のようなさまざまなケースの検討が必要です。

シングルジョブシンプルなシングルジョブ
大量のシングルジョブを配列にしてスループットを向上
並列ジョブネットワークを介するMPI並列
スレッドがノード内に限定されたスレッド並列(OpenMP)
Hybrid-MPI並列 (MPIとOpenMP)
コンテナ化されたジョブDockerジョブ
Singularityジョブ
計算リソースの指定実行時間
メモリ量
GPU数
商用アプリケーションの利用可能なライセンス数
依存関係のジョブ上記のさまざまなジョブ同士の連携を設定
スケジューリングユーザーやグループ毎に使用可能な計算リソースを指定
ジョブ実行時のリソース予約

また、ジョブ管理システムでは、ジョブの運用で問題が生じた場合に、問題を検証できるだけのログを取得できることがとても重要です。Altair® Grid Engine® ではデフォルトで利用可能な稼働統計ツールも充実しており、何が原因でジョブが終了たのかを調べるための手がかりが豊富に用意されています。

サポートサービスの充実した商用ジョブ管理ソフトウェア

Altair® Grid Engine® は、商用のソフトウェアであり、問題解決のための正確なサポートが開発元から得られます。ジョブ運用の現場で発生している問題はとても複雑であり、その解決のために高度に専門的な知見が必要となる場合があります。ジョブ管理システムは、システムの運用において極めて重要な機能ですので、弊社では、サポートサービスが充実した Altair® Grid Engine® を強くお勧めしています。

HPC-ProSupportを標準実装

HPC-ProSupport は、ハードウェア・ソフトウェアを問わずユーザーの問題解決・負担軽減を目的としたサポートパッケージです。ハードウェアに加えて、OS 及びソフトウェア設定を含めて一元的なサポートサービスを提供します。複数のハードウェアベンダーで構成されることの多い計算機システムにおいて、問い合わせの一次窓口として、サポートを取りまとめる機能も備えます。ハードウェアの保守年数は最長7 年、サポートレベルは当日4 時間以内対応から翌営業日対応まで選択可能。ユーザーの運用形態に合わせて多様なサポートサービスを御提案します。

保守窓口受付時間

平日9:00~17:00
お問い合わせは、電話または電子メールの利用が可能です。
メールについては、本ホームページのメール問い合わせフォームからご連絡ください。
※年末年始及び弊社の指定する休日(夏季休暇等)は、窓口を休みにさせて頂く場合があります。

ソフトウェア、ハードウェアを問わない一貫したサポート窓口

ジョブが動かない - 障害の通知としてはよくある典型的なお問い合わせの内容ですが、原因としては多くの可能性が考えられます。正しい原因にたどり着くために、さまざまな検討が必要です。ハードウェアベンダーのサポートでは、このような障害の連絡はほぼ間違いなく門前払い的な対応になるでしょうし、ソフトウェアの問題だとしても、どのソフトウェアの問題なのか切り分けるのは極めて大変です。OSなのか?、ジョブ管理ソフトなのか?、コンパイラなのか?、MPIなのか?そのようなときに、「ジョブが動かない」と簡単に相談いただけるのが、当社のHPC-ProSupportの保守サービスです。

​障害の発生時には、ハードウェア、ソフトウェアの障害を切り分けし、必要な措置を取ります。昨今のシステムでは、単一ベンダー製品で構成されることは少なく、複数メーカーの製品で構成されたマルチベンダー環境になることが通常です。そのようなマルチベンダー環境においても、一元化されたサポート窓口を御提供します。パーツの交換が必要であれば、ハードウェアメーカーへ連絡し、お客様に代わって交換品や交換要員の手配を行います。障害の内容によっては、BIOSやファームウェア、OSのアップグレードが必要なため、そのような対応をする場合があります。弊社には、リモート保守を実施するためのリソースがあるため、それを利用しリモートから接続させて頂いて、ネットワーク越しに調査・対応させて頂く場合もあります。その他、システムの御利用方法等のQAにも対応します。

アラートメール受信サービス

障害が発生した場合に、アラートメールを自動送信する設定を行います。そのアラートメールの送信先に弊社サポートのメールアドレスを含めることで、弊社サポート担当者もアラートメールを受信致します。そのため、迅速に障害復旧の段取りに着手することができます。また、そのアラートメールには、障害の解析に必要な様々なログが添付されていますので、お客様に解析用のログを取得頂く手間を極力軽減します。

仕様 : HPC-ProServer DPeR6615

CPU1 x AMD EPYC第4世代9004シリーズ(プロセッサーあたり最大96コア)
メモリ12 DDR5 DIMMスロット、最大768GB*のRDIMMをサポート、最大速度4800 MT/s
Registered ECC DDR5 DIMMのみをサポート
ストレージ コントローラー内蔵コントローラー:
 PERC H965i、PERC H755、PERC H755N、PERC H355、HBA355i
内部ブート:
 起動最適化ストレージ サブシステム(BOSS-N1)︓HWRAID 2 x M.2 NVMe SSDまたはUSB
外部HBA(RAID非対応):
 HBA355e
ソフトウェアRAID:
 S160
ドライブ ベイ前面ベイ:
 最大4台の3.5インチSAS/SATA (HDD/SSD)最大80 TB
 最大8台の2.5インチNVMe (SSD)最大122.88 TB
 最大10台の2.5インチSAS/SATA/NVMe (HDD/SSD)最大153.6 TB
背面ベイ:
 最大2台の2.5インチSAS/SATA (HDD/SSD)最大30.72 TB
電源装置1800 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
1400 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
1100 WチタニウムAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
1100 W LVDC DC -48~-60 Vホット スワップ冗長
800 WプラチナAC 100~240 Vまたは240 HVDC、ホット スワップ冗長
700 WチタニウムAC 200~240 Vまたは240 HVDC、ホット スワップ冗長
冷却オプション空冷
オプションの直接液体冷却(DLC)*
メモ︓DLCとはラックのソリューションで、ラック マニホールドと冷却材配分ユニット(CDU)が動作する必要があります。
ファン標準(STD)ファン/ハイ パフォーマンス ゴールド(VHP)ファン
最大4セット(デュアル ファン モジュール)のホット プラグ ファン
寸法高さ:
 42.8 mm(1.685インチ)
幅:
 482 mm(18.97インチ)
奥行き:
 822.89 mm(32.39インチ)(ベゼルを含む)
 809.05 mm(31.85インチ)(ベゼルを含まない)
フォーム ファクター1Uラック サーバー
組み込み型管理iDRAC9
iDRACダイレクト
Redfish の iDRAC RESTful API
iDRACサービス マニュアル
Quick Sync 2ワイヤレス モジュール
ベゼルLCDベゼルまたはセキュリティ ベゼル(オプション)
OpenManageOpenManage Enterprise
OpenManage Power Managerプラグイン
OpenManageサービス プラグイン
OpenManage Update Managerプラグイン
CloudIQ for PowerEdgeプラグ イン
OpenManage Enterprise Integration for VMware vCenter
OpenManage Integration for Microsoft System Center
OpenManage Integration with Windows Admin Center
セキュリティAMD Secure Encrypted Virtualization(SEV)
AMD Secure Memory Encryption(SME)
暗号化形式で署名されたファームウェア
静止データ暗号化(ローカルまたは外部キー管理を使用したSED)
セキュア ブート
Secured Component Verificatio(ハードウェア整合性チェック)
完全消去
シリコン ルート オブ トラスト
System Lockdown(iDRAC9 EnterpriseまたはDatacenterが必要)
TPM 2.0 FIPS、CC-TCG認証、TPM 2.0 China NationZ
組込み NIC2 x 1 GbE LOMカード(オプション)
ネットワーク
オプション
1 x OCP 3.0カード(オプション)
メモ:システムでは、LOMカードまたはOCPカードのいずれか、または両方をシステムにインストールすることができます。
GPUオプション最大3 x 75 W SW
ポート前面ポート:
 1 x iDRACダイレクト(Micro-AB USB)ポート
 1 x USB 2.0
 1 x VGA
背面ポート:
 1 x 専用iDRAC Ethernetポート
 1 x USB 3.0
 1 x USB 2.0
 1 x シリアル(オプション)
 1 x VGA(直接液体冷却構成の場合はオプション*)
内部ポート:
 1 x USB 3.0(オプション)
PCIe最大3個のPCIeスロット:
 スロット1︓1 x16 Gen5または1 x16 Gen4ロー プロファイル、ハーフ レングスまたは1 x16 Gen5フル ハイト、ハーフ レングス、または2 x8
Gen4ロー プロファイル、ハーフ レングス
 スロット2︓1 x16 Gen5または1 x16 Gen4ロー プロファイル、ハーフ レングスまたは1 x16 Gen5フル ハイト、ハーフ レングス、または2 x8
Gen4ロー プロファイル、ハーフ レングス
 スロット3︓1 x16 Gen5または1 x16 Gen4ロー プロファイル、ハーフ レングス
OSCanonical Ubuntu Server LTS
Hyper-V搭載Microsoft Windows Server
Red Hat Enterprise Linux
SUSE Linux Enterprise Server
VMware ESXi
RockyLinux
AlmaLinux