サーバーの利用方法, マニュアル / トラブルシューティング / Altair Grid Engine ( AGE ) の利用方法 等、HPCテクノロジーズの計算機システムを利用する上で、有用な情報、及び、よくある質問をまとめました。
トラブルシューティング
サーバーが起動しない(電源が入らない)場合の対処法
RHEL , CentOS , RockyLinux で パスワード を忘れた場合の対応方法
Ubuntuでパスワードが分からなくなった場合の対応方法
omreportによるログの取得方法
TSR(Technical Support Report)のCLIによる取得方法
【 HPC-ProServer 】 冷却ファン の回転数(稼働音)を制御したい
【 HPC-ProServer 】 サーバー内部の温度を知りたい
【HPC-ProUPS】 バッテリーに関するメッセージ意味と対処
【AGE】ジョブが”qw”のまま実行されない理由が知りたい
サポート対象のオペレーティングシステム
第16世代サーバー ・・・ HPC-ProServer DPeR660, R760, R960, R6615, R7615等
第15世代サーバー ・・・ HPC-ProServer DPeR650, R750, R450, R6515, R7515等
第14世代サーバー ・・・ HPC-ProServer DPeR640, R740, R440等
第13世代サーバー ・・・ HPC-ProServer DPeR630, R730, R430等
第12世代サーバー ・・・ HPC-ProServer DPeR620, R720, R420等
第11世代サーバー ・・・ HPC-ProServer DPeR610, R710, R410等
開発環境
Intel® oneAPI Math Kernel Library (oneMKL) Link Line Advisor の御紹介
Altair Grid Engine
よく使用するコマンドの使用方法 (manページ邦訳)
- qsub
利用方法
シンプルなジョブの投入方法
シンプルな並列ジョブの投入方法
Dockerジョブの基本的な実行方法 – nvidia-dockerを使用しない場合
ホストを指定してジョブを実行する方法
ジョブの実行順を制御したい~ -hold_jidオプションの利用~