SLURM:実行スクリプトサンプル
| 登録日 | :2023/07/30 16:02 |
|---|---|
| カテゴリ | :SLURM |
SLURMにてジョブを実行する際に、実行ノードを取得するスクリプトを検討してみている。
SLURM_JOB_NUM_NODESで取得ができるかもしれない。
実行スクリプトのサンプルをメモする。
[user01@newhead work]$ cat job.sh
#!/bin/bash
#SBATCH --partition=cls3
#SBATCH --nodes=2
#SBATCH --ntasks=2
#SBATCH -J test
#SBATCH -o stdout.%J
#SBATCH -e stderr.%J
echo ${SLURM_NTASKS} > ntasks
echo ${SLURM_JOB_NODELIST} > nodelist
echo ${SLURM_JOB_NUM_NODES} > num_node
srun -n ${SLURM_NTASKS} hostname > nhosts
srun -N ${SLURM_JOB_NUM_NODES} hostname > hosts
#python3 job.py
mpiexec -n ${SLURM_NTASKS} python3 job.py
echo ${SLURM_TASK_PID} > PID.log