頑丈な機械のHAを触るのはとっても怖い

商用UNIXというのはとっても頑丈にできていて、ハードもOSもしっかり作り込んであるからすこぶる快調に動き続けます。システムの寿命=減価償却期間=uptimeなことも普通でしょう。

だけどももしかしたら何かあるかも形あるものいつかは壊れますし。念のために、ということで待機系を準備してあったりします。

そしてその「何か」があったときに用意してある待機系が動かなかったら意味がないので、時々切り替えたりして正常に動くことを確認したりします。

さてそんな待機系を持ったサーバ群にちょいと変更をすることになりました。長いこと一切の変更を加えずに動き続けてる機械の設定変更すんのめっちゃ怖い。

AIXクラスタの仕組みを実装している PowerHA 6.1 で smitty cl_mkfs にてファイルシステム作ろうとしたらエラー。

 

/usr/es/sbin/cluster/sbin/cl_crfs[XXXX]: print: 0403-010 指定されたフラグはこのコマンドでは無効です。

 

もしかして日本語ロケールがダメなのかな、LANG=C すればいけるかな?と思ってやってみたけど同じで。

 

/usr/es/sbin/cluster/sbin/cl_crfs[XXXX]: print: 0403-010 A specified flag is not valid for this command.

 

クラスタの状態がおかしくなってしまったのだろうか、でもログ見ても何もエラーなど出ていないし。

おかしいな、と F6 でコマンドラインを確認してみると。

 

/usr/es/sbin/cluster/sbin/cl_crfs -cspoc -n'node01,node02' -v jfs2 -d'lv001' -v jfs2 -d'' -m'/share/fs001' -p'rw' -a agblksize='4096'

 

おおう、 -v と -d が2回指定されているよ。なんだよ smitty 側の問題かよ。

不要な -v と -d を省いてコマンドラインから入力したところ無事ファイルシステムが作れました。

 

/usr/es/sbin/cluster/sbin/cl_crfs -cspoc -n'node01,node02' -v jfs2 -d'lv001' -m'/share/fs001' -p'rw' -a agblksize='4096'

 

よかった。

ついでに、双方のノードで /etc/filesystems の整合性が取れてなくても大丈夫、マウントポイントが待機系に無くても大丈夫。リソースがフェイルオーバーするときに待機系のファイルシステムまわりの設定は正しく書き換えられマウントポイントもきちんと準備されます。