本章では、以下の条件で稼働しているものとします。
CentOS v7.5
Altair GridEngine 8.6.x
docker-ce-18.03.1.ce-1.el7.centos.x86_64
Altair Grid Engine (AGE) では、サポートするDockerのバージョンが細かく決まっていますのでご注意ください。詳しくはリリースノートを確認する必要があります。AGEのサポート外のバージョンのDockerを使用する場合には、AGEの提供するDocker Integrationは利用できない場合があります。
AGEがサポートするDockerが稼働している場合、以下のようにcomplex_value dockerに1の値が与えられます。
# qhost -F docker
HOSTNAME ARCH NCPU NSOC NCOR NTHR NLOAD MEMTOT MEMUSE SWAPTO SWAPUS
———————————————————————————————-
global – – – – – – – – – –
node01 lx-amd64 32 2 32 32 0.00 140.8G 6.6G 32.0G 11.5M
hl:docker=1
node02 lx-amd64 32 2 32 32 0.00 140.8G 4.6G 32.0G 0.0
hl:docker=1
以下は、CPU版Tensorflowを実行する場合のスクリプトの例です。
!/bin/bash $ -cwd $ -l docker $ -l docker_images=”tensorflow/tensorflow:latest“ $ -xd “-v /home:/home” python ./tf_cnn_benchmarks.py –model trivial –batch_size 32 |
オプションの説明
-l docker :
AGEがサポートしているdockerが稼働しているホストリソースを指定します。
-l docker_images :
dockerイメージを指定します。上記例のようにアスタリスクを使用してください。
-xd “-v /home:/home” :
-xdオプションは、docker runコマンドへ引き継がれるオプションを指定します。ここでは、-vオプションを使用してボリューム共有を行っています。-xdオプションとして、コンテナの削除を指定する–rmオプションをつけなくても、AGEが自動的にジョブ終了時にコンテナを削除します。
コマンドライン :
docker runを使用してコンテナ上で実行されるコマンドを指定します。