support

本章では、以下の条件で稼働しているものとします。

CentOS v7.5
Altair GridEngine 8.6.x
docker-ce-18.03.1.ce-1.el7.centos.x86_64

​Altair Grid Engine (AGE) では、サポートするDockerのバージョンが細かく決まっていますのでご注意ください。詳しくはリリースノートを確認する必要があります。AGEのサポート外のバージョンのDockerを使用する場合には、AGEの提供するDocker Integrationは利用できない場合があります。

​AGEがサポートするDockerが稼働している場合、以下のようにcomplex_value dockerに1の値が与えられます。

# qhost -F docker
HOSTNAME                ARCH         NCPU NSOC NCOR NTHR NLOAD  MEMTOT  MEMUSE  SWAPTO  SWAPUS
———————————————————————————————-
global                  –               –    –    –    –     –       –       –       –       –
node01                  lx-amd64       32    2   32   32  0.00  140.8G    6.6G   32.0G   11.5M
   hl:docker=1
node02                  lx-amd64       32    2   32   32  0.00  140.8G    4.6G   32.0G     0.0
   hl:docker=1

以下は、CPU版Tensorflowを実行する場合のスクリプトの例です。

!/bin/bash
$ -cwd
$ -l docker
$ -l docker_images=”tensorflow/tensorflow:latest
$ -xd “-v /home:/home”
python ./tf_cnn_benchmarks.py –model trivial –batch_size 32
dockerジョブの実行例
オプションの説明

-l docker : 
AGEがサポートしているdockerが稼働しているホストリソースを指定します。

-l docker_images :
dockerイメージを指定します。上記例のようにアスタリスクを使用してください。

-xd “-v /home:/home” :
-xdオプションは、docker runコマンドへ引き継がれるオプションを指定します。ここでは、-vオプションを使用してボリューム共有を行っています。-xdオプションとして、コンテナの削除を指定する–rmオプションをつけなくても、AGEが自動的にジョブ終了時にコンテナを削除します。

コマンドライン :
docker runを使用してコンテナ上で実行されるコマンドを指定します。