KnowHow

技術的なメモを中心にまとめます。
検索にて調べることができます。

GPFS(IBM Spectrum Scale)+ CES(NFS-Ganesha)環境で「pingは通るがNFSマウントできない」障害を調査する際に有効なログファイルやコマンド

登録日 :2025/07/09 21:04
カテゴリ :Linux

GPFS(IBM Spectrum Scale)+ CES(NFS-Ganesha)環境で「pingは通るがNFSマウントできない」障害を調査する際に有効なログファイルやコマンドをまとめます。

1. NFS-Ganesha関連のログ
/var/log/ganesha/ganesha.log

NFS-Ganesha本体の詳細な動作ログです。
→ NFSリクエストの受信状況、エラー、アクセス拒否、内部エラーなどが記録されます。

/var/log/messages または /var/log/syslog

システム全体のログ。NFSサービスの起動・停止・異常やネットワーク関連のエラーも記録されます。

2. GPFS(Spectrum Scale)関連のログ
/var/adm/ras/mmfs.log.latest

GPFSクラスタやファイルシステムの状態、ノード間通信のエラーなどが記録されます。

/var/adm/ras/cesEvents.log

CES関連のイベント・障害情報が記録されます。

3. 状態確認・切り分け用コマンド

NFS-Ganeshaサービスの状態

systemctl status nfs-ganesha

NFSエクスポート状況の確認

showmount -e <CESノードのIP>

NFSサービスのポート公開状況

rpcinfo -p <CESノードのIP>

GPFSクラスタ・ノード状態

mmgetstate -a
mmlscluster
mmces state show

ファイルシステムのマウント状況

mmlsmount all -L
df -h

ファイアウォール・ポート確認

firewall-cmd --list-all
ss -tulpn | grep 2049
4. クライアント側の確認

マウントエラー時のメッセージ(/var/log/messages や dmesg)

マウントコマンドの実行結果・エラー内容

5. 追加のポイント

仮想IP(サービスIP)の割り当て状況

mmces address list

CESノードのロール・サービス状態

mmces service list
mmces node list

まとめ
障害調査の際は、
NFS-Ganeshaのログ(/var/log/ganesha/ganesha.log)・GPFSのログ(/var/adm/ras/mmfs.log.latest)・CESイベントログ(/var/adm/ras/cesEvents.log)
および上記コマンドで、
NFSサービス・GPFSクラスタ・ネットワーク・エクスポート設定の各観点から切り分けてください。

ログやコマンドの出力を整理し、エラーや警告メッセージをもとに障害箇所を特定することが重要です。
必要に応じてIBMサポートにもログを提出できるよう、各種ログファイルを保存しておきましょう。


mmces address list コマンド

mmces address list コマンドは、CES(Cluster Export Services)ノードに割り当てられているサービスIP(仮想IP)の一覧と、そのIPが現在どのノードで有効になっているかを表示します。

期待される「正常な」出力例

Address           CES Node         State
-----------------------------------------------
192.168.10.101    node01           active
192.168.10.102    node02           active

または、仮想IPが1つの場合:

Address           CES Node         State
-----------------------------------------------
192.168.10.101    node01           active

mmces node list

mmces node list コマンドを実行すると、CES(Cluster Export Services)クラスタに参加しているノードの一覧が表示されます。
この一覧には、各ノードの名前や、グループ、状態などが含まれます。

想定される応答例

Node      CES Group    State
-----------------------------------------
node1     group1       active
node2     group1       active
node3     group2       suspended
node4     group2       active
Node: ノード名

CES Group: そのノードが属するCESグループ名

State: ノードの状態(active, suspended など)

オプションによる表示例
mmces node list --verbose を使うと、より詳細な情報(IPアドレスやサービス状態など)が追加で表示される場合があります。

参考
コマンドの詳細や出力例はIBM公式ドキュメントにも記載されています。

まとめ
mmces node list の標準的な応答は、CESクラスタに属する各ノードの一覧と、そのグループや状態のテーブル表示です。


以下のコマンドで、正常時に想定される結果は?

mmgetstate -a
mmlscluster
mmces state show

以下のコマンドで、正常時に想定される結果は? mmgetstate -a mmlscluster mmces state show
ご質問の3つのコマンドについて、GPFS(IBM Spectrum Scale)クラスタが正常稼働している場合の想定される出力例と、確認すべきポイントをまとめます。

1. mmgetstate -a

目的:
クラスタ内の各ノードのGPFS(mmfs)デーモンの状態を確認します。

正常時の出力例:

Node number  Node name    GPFS state
------------------------------------------
      1      node01       active
      2      node02       active
      3      node03       active

チェックポイント:

すべてのノードが active になっていること

down や arbitrating, unknown などが表示されていないこと

2. mmlscluster

目的:
クラスタの構成情報(クラスタ名、ノード一覧、役割など)を表示します。

正常時の出力例:

GPFS cluster information
=======================
  Cluster name:         mycluster.gpfs.net
  Cluster id:           123456789
  GPFS version:         5.1.5.0 (または環境に応じたバージョン)
  Recovery domain id:   1
  Servers:
    Node name    IP address
    --------------------------------
    node01       192.168.1.1
    node02       192.168.1.2
    node03       192.168.1.3

GPFS cluster configuration servers:
    node01
    node02

GPFS cluster nodes:
    node01
    node02
    node03

チェックポイント:

すべてのノードがリストされていること

クラスタ名やバージョンが正しいこと

3. mmces state show

目的:
CES(Cluster Export Services)機能の状態を確認します。

正常時の出力例:

CES state: enabled

CES services:
  NFS: enabled
  SMB: disabled
  Object: disabled

CES nodes:
  Node name    CES state
  -------------------------
  node01       enabled
  node02       enabled

チェックポイント:

CES state: enabled になっていること

利用したいサービス(NFSなど)が enabled になっていること

すべてのCESノードが enabled になっていること

まとめ
すべてのノード・サービスが "active" や "enabled" であることが正常の目安

異常時は down, arbitrating, disabled, unknown などが表示されます

この3コマンドの出力がすべて正常であれば、GPFSクラスタとCESサービスの基盤は健全と判断できます。
もし異常な状態が表示された場合は、そのノードやサービスに問題がある可能性が高いです。


PFSSサーバでの各コマンドの影響について
PFSSのサーバで、以下のコマンドを入力しても、影響はないと考えて良いですか(現状のステータスを確認するだけ)

mmces address list
mmces service list
mmces node list
mmgetstate -a
mmlscluster
mmces state show

ご質問のコマンドは、いずれも「現状のステータスや構成情報を表示するだけ」の参照系コマンドです。
実行してもシステム設定やサービスの動作には一切影響ありませんので、安心してご利用いただけます。

各コマンドの概要
コマンド 内容・用途 影響
mmces address list CES(Cluster Export Services)のIPアドレス割当状況を一覧表示 なし(参照のみ)
mmces service list 有効化・稼働中のCESプロトコルサービス(NFS, SMB, S3等)の一覧表示 なし(参照のみ)
mmces node list CESノードのリストやグループ情報を表示 なし(参照のみ)
mmgetstate -a GPFSクラスタ内全ノードの状態(アクティブ/ダウン等)を表示 なし(参照のみ)
mmlscluster クラスタ全体の構成情報(ノード一覧、管理者ノード等)を表示 なし(参照のみ)
mmces state show 各CESコンポーネント(NFS, SMB, S3等)の状態(HEALTHY/FAILED等)を表示 なし(参照のみ)
詳細
いずれも「表示・確認」専用コマンドであり、
システム設定やサービスの起動・停止、データの変更などは一切行いません。

管理者や運用担当者が「現在の状態を確認する」「トラブルシュートのために情報を取得する」目的で日常的に使われています。

逆に、「add」「remove」「start」「stop」などのコマンドはシステムに影響を与えるため注意が必要ですが、
今回ご提示のコマンドは該当しません。

まとめ
ご提示の6つのコマンドは、現状のステータスや構成を確認するだけで、システムやサービスに影響を与えることはありません。

安心して実行できます。

何か追加で確認したいコマンドや詳細があれば、お気軽にご質問ください。