GPFS(IBM Spectrum Scale)+ CES(NFS-Ganesha)環境で「pingは通るがNFSマウントできない」障害を調査する際に有効なログファイルやコマンド
| 登録日 | :2025/07/09 21:04 |
|---|---|
| カテゴリ | :Linux |
GPFS(IBM Spectrum Scale)+ CES(NFS-Ganesha)環境で「pingは通るがNFSマウントできない」障害を調査する際に有効なログファイルやコマンドをまとめます。
1. NFS-Ganesha関連のログ
/var/log/ganesha/ganesha.log
NFS-Ganesha本体の詳細な動作ログです。
→ NFSリクエストの受信状況、エラー、アクセス拒否、内部エラーなどが記録されます。
/var/log/messages または /var/log/syslog
システム全体のログ。NFSサービスの起動・停止・異常やネットワーク関連のエラーも記録されます。
2. GPFS(Spectrum Scale)関連のログ
/var/adm/ras/mmfs.log.latest
GPFSクラスタやファイルシステムの状態、ノード間通信のエラーなどが記録されます。
/var/adm/ras/cesEvents.log
CES関連のイベント・障害情報が記録されます。
3. 状態確認・切り分け用コマンド
NFS-Ganeshaサービスの状態
systemctl status nfs-ganesha
NFSエクスポート状況の確認
showmount -e <CESノードのIP>
NFSサービスのポート公開状況
rpcinfo -p <CESノードのIP>
GPFSクラスタ・ノード状態
mmgetstate -a
mmlscluster
mmces state show
ファイルシステムのマウント状況
mmlsmount all -L
df -h
ファイアウォール・ポート確認
firewall-cmd --list-all
ss -tulpn | grep 2049
4. クライアント側の確認
マウントエラー時のメッセージ(/var/log/messages や dmesg)
マウントコマンドの実行結果・エラー内容
5. 追加のポイント
仮想IP(サービスIP)の割り当て状況
mmces address list
CESノードのロール・サービス状態
mmces service list
mmces node list
まとめ
障害調査の際は、
NFS-Ganeshaのログ(/var/log/ganesha/ganesha.log)・GPFSのログ(/var/adm/ras/mmfs.log.latest)・CESイベントログ(/var/adm/ras/cesEvents.log)
および上記コマンドで、
NFSサービス・GPFSクラスタ・ネットワーク・エクスポート設定の各観点から切り分けてください。
ログやコマンドの出力を整理し、エラーや警告メッセージをもとに障害箇所を特定することが重要です。
必要に応じてIBMサポートにもログを提出できるよう、各種ログファイルを保存しておきましょう。
mmces address list コマンド
mmces address list コマンドは、CES(Cluster Export Services)ノードに割り当てられているサービスIP(仮想IP)の一覧と、そのIPが現在どのノードで有効になっているかを表示します。
期待される「正常な」出力例
Address CES Node State
-----------------------------------------------
192.168.10.101 node01 active
192.168.10.102 node02 active
または、仮想IPが1つの場合:
Address CES Node State
-----------------------------------------------
192.168.10.101 node01 active
mmces node list
mmces node list コマンドを実行すると、CES(Cluster Export Services)クラスタに参加しているノードの一覧が表示されます。
この一覧には、各ノードの名前や、グループ、状態などが含まれます。
想定される応答例
Node CES Group State
-----------------------------------------
node1 group1 active
node2 group1 active
node3 group2 suspended
node4 group2 active
Node: ノード名
CES Group: そのノードが属するCESグループ名
State: ノードの状態(active, suspended など)
オプションによる表示例
mmces node list --verbose を使うと、より詳細な情報(IPアドレスやサービス状態など)が追加で表示される場合があります。
参考
コマンドの詳細や出力例はIBM公式ドキュメントにも記載されています。
まとめ
mmces node list の標準的な応答は、CESクラスタに属する各ノードの一覧と、そのグループや状態のテーブル表示です。
以下のコマンドで、正常時に想定される結果は?
mmgetstate -a
mmlscluster
mmces state show
以下のコマンドで、正常時に想定される結果は? mmgetstate -a mmlscluster mmces state show
ご質問の3つのコマンドについて、GPFS(IBM Spectrum Scale)クラスタが正常稼働している場合の想定される出力例と、確認すべきポイントをまとめます。
1. mmgetstate -a
目的:
クラスタ内の各ノードのGPFS(mmfs)デーモンの状態を確認します。
正常時の出力例:
Node number Node name GPFS state
------------------------------------------
1 node01 active
2 node02 active
3 node03 active
チェックポイント:
すべてのノードが active になっていること
down や arbitrating, unknown などが表示されていないこと
2. mmlscluster
目的:
クラスタの構成情報(クラスタ名、ノード一覧、役割など)を表示します。
正常時の出力例:
GPFS cluster information
=======================
Cluster name: mycluster.gpfs.net
Cluster id: 123456789
GPFS version: 5.1.5.0 (または環境に応じたバージョン)
Recovery domain id: 1
Servers:
Node name IP address
--------------------------------
node01 192.168.1.1
node02 192.168.1.2
node03 192.168.1.3
GPFS cluster configuration servers:
node01
node02
GPFS cluster nodes:
node01
node02
node03
チェックポイント:
すべてのノードがリストされていること
クラスタ名やバージョンが正しいこと
3. mmces state show
目的:
CES(Cluster Export Services)機能の状態を確認します。
正常時の出力例:
CES state: enabled
CES services:
NFS: enabled
SMB: disabled
Object: disabled
CES nodes:
Node name CES state
-------------------------
node01 enabled
node02 enabled
チェックポイント:
CES state: enabled になっていること
利用したいサービス(NFSなど)が enabled になっていること
すべてのCESノードが enabled になっていること
まとめ
すべてのノード・サービスが "active" や "enabled" であることが正常の目安
異常時は down, arbitrating, disabled, unknown などが表示されます
この3コマンドの出力がすべて正常であれば、GPFSクラスタとCESサービスの基盤は健全と判断できます。
もし異常な状態が表示された場合は、そのノードやサービスに問題がある可能性が高いです。
PFSSサーバでの各コマンドの影響について
PFSSのサーバで、以下のコマンドを入力しても、影響はないと考えて良いですか(現状のステータスを確認するだけ)
mmces address list
mmces service list
mmces node list
mmgetstate -a
mmlscluster
mmces state show
ご質問のコマンドは、いずれも「現状のステータスや構成情報を表示するだけ」の参照系コマンドです。
実行してもシステム設定やサービスの動作には一切影響ありませんので、安心してご利用いただけます。
各コマンドの概要
コマンド 内容・用途 影響
mmces address list CES(Cluster Export Services)のIPアドレス割当状況を一覧表示 なし(参照のみ)
mmces service list 有効化・稼働中のCESプロトコルサービス(NFS, SMB, S3等)の一覧表示 なし(参照のみ)
mmces node list CESノードのリストやグループ情報を表示 なし(参照のみ)
mmgetstate -a GPFSクラスタ内全ノードの状態(アクティブ/ダウン等)を表示 なし(参照のみ)
mmlscluster クラスタ全体の構成情報(ノード一覧、管理者ノード等)を表示 なし(参照のみ)
mmces state show 各CESコンポーネント(NFS, SMB, S3等)の状態(HEALTHY/FAILED等)を表示 なし(参照のみ)
詳細
いずれも「表示・確認」専用コマンドであり、
システム設定やサービスの起動・停止、データの変更などは一切行いません。
管理者や運用担当者が「現在の状態を確認する」「トラブルシュートのために情報を取得する」目的で日常的に使われています。
逆に、「add」「remove」「start」「stop」などのコマンドはシステムに影響を与えるため注意が必要ですが、
今回ご提示のコマンドは該当しません。
まとめ
ご提示の6つのコマンドは、現状のステータスや構成を確認するだけで、システムやサービスに影響を与えることはありません。
安心して実行できます。
何か追加で確認したいコマンドや詳細があれば、お気軽にご質問ください。