KnowHow

技術的なメモを中心にまとめます。
検索にて調べることができます。

SLURMのデフォルトメモリを確認する

登録日 :2024/05/21 04:44
カテゴリ :SLURM

SLURMでデフォルトのメモリ設定を確認するためには、以下のコマンドや設定ファイルをチェックする方法があります。デフォルトのメモリ設定はパーティションやノードに依存します。

1. scontrol show コマンドの使用

scontrol show コマンドを使用して、パーティションやノードの詳細情報を確認できます。

パーティションのデフォルトメモリを確認
パーティションの設定を確認するには、以下のコマンドを使用します。

scontrol show partition

出力例:

PartitionName=compute
   AllowGroups=ALL AllowAccounts=ALL AllowQos=ALL
   AllocNodes=ALL Default=YES QoS=N/A
   DefaultTime=00:30:00 DisableRootJobs=NO ExclusiveUser=NO GraceTime=0 Hidden=NO
   MaxNodes=UNLIMITED MaxTime=INFINITE MinNodes=1 LLN=NO MaxCPUsPerNode=UNLIMITED
   Nodes=node[001-020]
   PriorityJobFactor=1 PriorityTier=1 RootOnly=NO ReqResv=NO OverSubscribe=NO
   State=UP TotalCPUs=320 TotalNodes=20 SelectTypeParameters=NONE
   DefMemPerCPU=2048 MaxMemPerCPU=4096

DefMemPerCPU または MaxMemPerCPU のフィールドで、デフォルトのメモリ制限を確認できます。この例では、デフォルトのメモリ制限が DefMemPerCPU=2048 (2GB) です。

ノードのデフォルトメモリを確認
各ノードの設定を確認するには、以下のコマンドを使用します。

scontrol show node

出力例:

NodeName=node001
   Arch=x86_64 CoresPerSocket=16
   CPUAlloc=0 CPUErr=0 CPUTot=32 CPULoad=0.00
   AvailableFeatures=(null)
   ActiveFeatures=(null)
   Gres=(null)
   NodeAddr=node001 NodeHostName=node001
   OS=Linux RealMemory=128000 AllocMem=0 FreeMem=102400 Sockets=2 Boards=1
   State=IDLE ThreadsPerCore=2 TmpDisk=0 Weight=1 Owner=N/A MCS_label=N/A
   Partitions=compute
   BootTime=2023-05-20T12:34:56 SlurmdStartTime=2023-05-20T12:45:00
   CfgTRES=cpu=32,mem=128000M,billing=32
   AllocTRES=
   CapWatts=n/a
   CurrentWatts=n/a
   AveWatts=n/a

RealMemory フィールドで、そのノードの総メモリ量を確認できます。この例では、RealMemory=128000 (128GB) です。

2. SLURMの設定ファイルを確認

SLURMの設定ファイル slurm.conf には、デフォルトのメモリ設定が記述されていることがあります。このファイルは通常、システム管理者が管理する場所にあります。

設定ファイルの例:

# Partitions
PartitionName=compute Nodes=node[001-020] Default=YES MaxTime=INFINITE State=UP DefaultMemoryPerCPU=2048
DefaultMemoryPerCPU や DefMemPerCPU の設定を確認します。

3. 管理者に問い合わせる

場合によっては、システム管理者に問い合わせて、デフォルトのメモリ設定を確認するのが最も確実です。管理者はクラスターの具体的な設定や制限についての詳細な情報を持っています。

まとめ

SLURMでデフォルトのメモリ設定を確認する方法には、scontrol show partition や scontrol show node コマンドを使用する方法、またはSLURMの設定ファイル slurm.conf を確認する方法があります。これらの情報を活用して、ジョブのメモリ設定を適切に行うことが重要です。他に具体的な質問や不明点があれば、お知らせください。