AlphaFold2 Benchmark ~ タンパク質の立体構造予測プログラム

タンパク質の立体構造予測プログラム AlphaFold2 (https://github.com/google-deepmind/alphafold)の ベンチマーク 結果を掲載します。AlphaFold2は、DeepMind社が開発したタンパク質の立体構造予測プログラムであり、アミノ酸配列からタンパク質の立体構造を高い精度で予測することができます。また、GPU を利用することで高速に処理することが可能です。

入力に使用したFASTAファイル

T1050.fasta

>T1050 A7LXT1, Bacteroides Ovatus, 779 residues|
MASQSYLFKHLEVSDGLSNNSVNTIYKDRDGFMWFGTTTGLNRYDGYTFKIYQHAENEPGSLPDNYITDIVEMPDGRFWINTARGYVLFDKERDYFITDVTGFMKNLESWGVPEQVFVDREGNTWLSVAGEGCYRYKEGGKRLFFSYTEHSLPEYGVTQMAECSDGILLIYNTGLLVCLDRATLAIKWQSDEIKKYIPGGKTIELSLFVDRDNCIWAYSLMGIWAYDCGTKSWRTDLTGIWSSRPDVIIHAVAQDIEGRIWVGKDYDGIDVLEKETGKVTSLVAHDDNGRSLPHNTIYDLYADRDGVMWVGTYKKGVSYYSESIFKFNMYEWGDITCIEQADEDRLWLGTNDHGILLWNRSTGKAEPFWRDAEGQLPNPVVSMLKSKDGKLWVGTFNGGLYCMNGSQVRSYKEGTGNALASNNVWALVEDDKGRIWIASLGGGLQCLEPLSGTFETYTSNNSALLENNVTSLCWVDDNTLFFGTASQGVGTMDMRTREIKKIQGQSDSMKLSNDAVNHVYKDSRGLVWIATREGLNVYDTRRHMFLDLFPVVEAKGNFIAAITEDQERNMWVSTSRKVIRVTVASDGKGSYLFDSRAYNSEDGLQNCDFNQRSIKTLHNGIIAIGGLYGVNIFAPDHIRYNKMLPNVMFTGLSLFDEAVKVGQSYGGRVLIEKELNDVENVEFDYKQNIFSVSFASDNYNLPEKTQYMYKLEGFNNDWLTLPVGVHNVTFTNLAPGKYVLRVKAINSDGYVGIKEATLGIVVNPPFKLAAALQHHHHHH

ジョブの実行方法

python3 docker/run_docker.py \
  –fasta_paths=T1050.fasta \
  –model_preset=monomer \
  –max_template_date=2024-04-01 \
  –data_dir=[データファイルのディレクトリ] \
  –output_dir=[出力結果先]

ベンチマーク結果 ※実施日に対して降順で表示

ベンチマークNo.2
機器の特徴 (4) Intel Xeon Gold 6448H 2.4GHz 32C/64T + (4) NVIDIA RTX A6000
ベンチマーク実施日2024年4月27日
実行環境詳細HPC-ProServer DPeR960
CPU : (4) Intel Xeon Gold 6448H 2.4GHz 32C/64T
Mem : 4096GB (64) 64GB DDR5 4800MHz
SSD : 960GB SATA SSD
GPU : (4) NVIDIA RTX A6000
OS : RockyLinux 8.9
NVIDIA Driver : 550.54.15 , CUDA 12.4
Docker version 26.0.1, build d260a54
データは、25GbpsネットワークのNFS領域に配置
AlphaFold Version2.3.2
timeコマンド0.13user 0.01system 1:24:08elapsed 0%CPU (0avgtext+0avgdata 26880maxresident)k
808inputs+0outputs (3major+5042minor)pagefaults 0swaps
timings.json{
“features”: 3951.729302883148,
“process_features_model_1_pred_0”: 6.498595237731934,
“predict_and_compile_model_1_pred_0”: 232.60038781166077,
“process_features_model_2_pred_0”: 4.694603443145752,
“predict_and_compile_model_2_pred_0”: 204.78236889839172,
“process_features_model_3_pred_0”: 4.037086009979248,
“predict_and_compile_model_3_pred_0”: 203.1477324962616,
“process_features_model_4_pred_0”: 4.555547714233398,
“predict_and_compile_model_4_pred_0”: 199.04012203216553,
“process_features_model_5_pred_0”: 4.7832207679748535,
“predict_and_compile_model_5_pred_0”: 181.64868569374084,
“relax_model_2_pred_0”: 19.424469232559204
}
備考features : 3951.729302883148 sec , features以外 : 1065.21281933784 sec
ベンチマークNo.1
機器の特徴 (2) Intel Xeon Gold 6430 2.1GHz 32C/64T + (2) NVIDIA RTX 6000 Ada
ベンチマーク実施日2024年4月27日
実行環境詳細HPC-ProServer DPrR7960
CPU : (2) Intel Xeon Gold 6430 2.1GHz 32C/64T
Mem : 512GB (16) 32GB DDR5 4800MHz
SSD : 1TB M.2 NVMe
GPU : (2) NVIDIA RTX 6000 Ada
OS : RockyLinux 8.9
NVIDIA Driver : 550.54.15 , CUDA 12.4
Docker version 26.0.1, build d260a54
データは、25GbpsネットワークのNFS領域に配置
AlphaFold Version2.3.2
timeコマンド0.15user 0.01system 1:30:43elapsed 0%CPU (0avgtext+0avgdata 27152maxresident)k
0inputs+0outputs (0major+5101minor)pagefaults 0swaps
timings.json{
“features”: 4743.83895778656,
“process_features_model_1_pred_0”: 5.070164918899536,
“predict_and_compile_model_1_pred_0”: 146.5927164554596,
“process_features_model_2_pred_0”: 4.10901141166687,
“predict_and_compile_model_2_pred_0”: 130.53641939163208,
“process_features_model_3_pred_0”: 3.5964343547821045,
“predict_and_compile_model_3_pred_0”: 120.6664125919342,
“process_features_model_4_pred_0”: 3.591764450073242,
“predict_and_compile_model_4_pred_0”: 116.03167223930359,
“process_features_model_5_pred_0”: 3.603001594543457,
“predict_and_compile_model_5_pred_0”: 111.4774022102356,
“relax_model_2_pred_0”: 22.427526473999023
}
備考features : 4743.838958 sec , features以外 : 667.7025261 sec