PBS Professional は、Altair Engineering, Inc が開発するワークロード管理ソフトウェアであり、HPC 、AI、CAE 環境におけるジョブスケジューリング、CPU、メモリ、GPU等の計算リソースの管理を自動化し、ハードウェアとソフトウェアの使用効率を最大化します。小規模なクラスターからクラウド、大型計算機システムまで、あらゆる規模のシステムに対応し、計算リソースの効率的な活用を支援します。
導入のメリット
- 様々な属性を定義したジョブの待ち行列(キュー)を利用して、ジョブ実行のポリシー化。
- 複数の計算リソースから空いているリソースに対してジョブを自動実行
- ジョブは自動で実行され、結果ファイルを書き出し
- 複数ジョブの状態や履歴を照会できる
- ジョブ開始時間の予約や優先順位を設定できる
PBS Professional 概要図
様々なスケジューリングに対応
PBS Professionalでは、以下のスケジューリング方式を単独で、または組み合わせて使用することができます。例えば、FIFO を基本としつつ、特定のジョブに高い優先度を割り当てる、といった運用が可能です。
さらに、PBS Professional は、ジョブの特性やリソースの状況に応じて、最適なスケジューリング方式を動的に選択する機能も備えています。これにより、システム全体のスループット向上、リソースの効率的な活用、ユーザー満足度の向上が期待できます。
ファースト・イン・ファースト・アウト (FIFO)
ジョブが投入された順序通りに実行する、最もシンプルなスケジューリング方式
プライオリティ
ジョブに優先度を割り当て、優先度の高いジョブから順に実行する方式
フェアシェア
ユーザー、グループ、プロジェクトなどにリソースを公平に配分する方式です。過去の使用状況や割り当てられたリソースの割合に基づいて、ジョブの実行順序を決定します。
予算配分管理(Budget and Allocation Management)
システム管理者がグループにサービスユニット(SU:予算)を提供。グループマネージャは管理するプロジェクトや個別のユーザにSUを配分します。SUの提供を受けたユーザは、そのSUを消費することでジョブ実行できる。期間内のSUを追跡することで、使用方法を管理します。
Strict Ordering
ジョブの優先度に従って並び替えられたルールに従い、追い越しを許可しない設定
Backfilling
優先度の高いジョブの実行を妨げない範囲で、待ち行列にある優先度の低いジョブを先に実行する機能
Cloud Bursting
クラウドバーストとは、クラスタ需要のピークに対処するためにオンプレミスのクラスタとパブリッククラウドとの間で設定される構成です。オンプレミスクラスタのリソース容量が一定に達すると、需要がパブリッククラウドに誘導されるため、サービスが中断することはありません。Cloud Bursting には、サポートされているクラウド・プロバイダーのいずれかにすでにアカウントを持っていることが必要です。
Microsoft Azure
Amazon Web Services (AWS)
Google Cloud Platform (GCP)
Oracle Cloud Platform
Orange Cloud Flexible Engine
Open Telekom Cloud (OTC)
HUAWEI Cloud
クラウドのバーストは、PBS Professionalを通じて1つまたは複数の指定されたクラウドキューにジョブを投入することで管理されます。サーバーの定期的なフックがクラウドキューを監視し、クラウドノードに対する需要を予測し、必要に応じてバーストまたはバースト解除によってノード数を動的に調整します。
Cloud Bursting 概念図
PBS Professional ライセンス
PBS Professionalのライセンスはデバイス数の従量制であり、デバイス数は、CPUソケット数 + GPU数 でカウントします。
ライセンス体系
製品名 | タイプ | カウント | 説明 |
---|---|---|---|
PBS Professional | 長期ライセンス | デバイス数 |
|
PBS Professional | 年間保守サポート | デバイス数 |
|
見積のご依頼、ご質問等は以下のメールフォームから
サポートOS (PBS Professional 2024.1.0 Release Notes から抜粋)
Dist. | Version | Chip set |
PBS Professional | Cloud + AMS | Budgets | Simulate | ||||
---|---|---|---|---|---|---|---|---|---|---|
Server Sched |
MoM on prem |
Comm | Client cmds |
Cloud module + AMS |
MoM burst node |
Head node + client cmds |
Head node |
|||
CentOS | 7 | x86_64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | Yes | Yes | Yes | No |
7 | ARM64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | No | Yes | No | No | |
Red Hat Enterprise Linux |
7 | x86_64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | Yes | Yes | Yes | Yes |
7 | ARM64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | No | Yes | No | Yes | |
7 MLS | x86_64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | No | No | No | No | |
8 | x86_64 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes | |
8 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | Yes | |
9 | x86_64 | Yes | Yes | Yes | Yes | Yes | Yes | No | Yes | |
9 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | Yes | |
Rocky |
8 | x86_64 | Yes | Yes | Yes | Yes | No | Yes | No | No |
8 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | No | |
9 | x86_64 | Yes | Yes | Yes | Yes | No | Yes | No | No | |
9 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | No | |
SUSE SLES |
12 | x86_64 | Yes | Yes | Yes | Yes | Yes | Yes | Yes | Yes |
12 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | No | |
15 | x86_64 | Yes | Yes | Yes | Yes | No | Yes | Yes | Yes | |
15 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | Yes | |
Ubuntu | 18.04 | x86_64 | Yes (d) | Yes (d) |
Yes (d) | Yes (d) | No | Yes | Yes | Yes |
18.04 | ARM64 | Yes (d) | Yes(d) | Yes (d) | Yes (d) | No | Yes | No | Yes | |
20.04 | x86_64 | Yes | Yes | Yes | Yes | No | Yes | Yes | Yes | |
20.04 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | Yes | |
22.04 | x86_64 | Yes | Yes | Yes | Yes | No | Yes | Yes | Yes | |
22.04 | ARM64 | Yes | Yes | Yes | Yes | No | Yes | No | Yes | |
HPE Cray Shasta | 1.1 SLES 15 |
x86_64 | Yes | Yes | Yes | Yes | Yes | No | Yes | Yes |
1.1 RHEL 7 |
x86_64 | Yes | Yes | Yes | Yes | No | No | No | Yes | |
NEC SX-Aurora TSUBASA | Yes | Yes | Yes | Yes | No | No | No | Yes | ||
Windows | 10 Pro | x86_64 | No | Yes | No | Yes | No | Yes | No | No |
11 Pro | x86_64 | No | Yes | No | Yes | No | Yes | No | No | |
Server 2016 | x86_64 | No | Yes | No | Yes | No | Yes | No | No | |
Server 2019 | x86_64 | No | Yes | No | Yes | No | Yes | No | No | |
Server 2022 | x86_64 | No | Yes | No | Yes | No | Yes | No | No |
A (d) indicates that support is deprecated.
PBS Professional is made up of the following components:
・PBS Professional server/scheduler daemon on PBS Professional server/scheduler host/head node
・PBS Professional MoM daemon on execution host/compute node, with the following options:
・On premise
・Burst in cloud via PBS Cloud (optional)
・PBS Professional client commands on PBS submission host/client host
・PBS Professional communication daemon on communication host
・PBS Cloud module on service node (where AMS module runs) (optional) (cannot be same host as Altair Control)
・Budgets server on PBS server host or separate Budgets head node
・Budgets AMS module on service node (where PBS Cloud module runs) (optional)
・Budgets client commands on PBS server host if separate from Budgets server host
・Budgets client commands on Budgets client host (optional)
・Simulate module:
・When using PBS Cloud, Simulate must be installed on PBS Professional server/scheduler host
・When not using PBS Cloud, Simulate can be installed on any supported host