KnowHow

技術的なメモを中心にまとめます。
検索にて調べることができます。

SLURM:実行スクリプトサンプル

登録日 :2023/07/30 16:02
カテゴリ :SLURM

SLURMにてジョブを実行する際に、実行ノードを取得するスクリプトを検討してみている。

SLURM_JOB_NUM_NODESで取得ができるかもしれない。
実行スクリプトのサンプルをメモする。

[user01@newhead work]$ cat job.sh
#!/bin/bash
#SBATCH --partition=cls3
#SBATCH --nodes=2
#SBATCH --ntasks=2
#SBATCH -J test
#SBATCH -o stdout.%J
#SBATCH -e stderr.%J


echo ${SLURM_NTASKS} > ntasks
echo ${SLURM_JOB_NODELIST} > nodelist
echo ${SLURM_JOB_NUM_NODES} > num_node
srun -n ${SLURM_NTASKS} hostname > nhosts
srun -N ${SLURM_JOB_NUM_NODES} hostname > hosts

#python3 job.py
mpiexec -n ${SLURM_NTASKS} python3 job.py

echo ${SLURM_TASK_PID} > PID.log