Windowsクラスター監視

Applications Managerに新規Windowsクラスター監視を作成するには、下記の手順に従います。

  1. 新規監視のリンクをクリックします。

  2. サーバー カテゴリでWindowsクラスターを選択してください。

  3. Windowsクラスターの表示名を指定します。
  4. クラスターの名前IPアドレスを入力してください。

  5. Windows Serverのバージョンをドロップダウンで選択します。
  6. ここでは、クラスター ドメイン管理者のユーザー名パスワードを使うことも、資格情報を認証情報マネージャーのドロップダウンで選ぶこともできます。クラスター ドメイン管理者の資格情報を利用する場合、ユーザー アカウントにクラスター サーバー ノードの「root\mscluster」名前空間でWMIクエリを実行する権限が必要です。

  7. ノード ディスカバリのオプションを選びます。選択肢は、ノードをディスカバリしないノードをディスカバリ・監視するです。

    ノードをディスカバリしない:こちらを選択すると、クラスター サーバー ノード群を、Windows Server1つとして検出しない挙動になります。ノードがすでにWindows Serverとして追加済みの場合はイベント ログ収集固有の目的で内部的にクラスター関連付けされます。

    ノードをディスカバリ・監視する:こちらを選択すると、クラスター サーバー ノード群を、Windows Server1つとして検出し、可用性とパフォーマンスを監視します。ノードがすでにWindows Serverとして追加済みの場合は再検出は行わず、既存サーバーは内部的にイベント ログ収集固有の目的でクラスターに関連付けられます。

  8. イベント ログ監視有効化のオプションを選択してください。

    • チェック付き:クラスター サーバー ノードすべてで、イベント ログ監視が有効になります。設定済みイベント ログ ルールで発生するイベントは、クラスターへとプロパゲートします。サーバーのイベント ログ収集中、クラスター イベントの収集とあわせて、アラートなしでデータベースにイベント追加を行います。そのちクラスターのデータ収集の際、全ノード分のイベントをデータベースから取得し、イベント ログ ルールにもとづきアラートをあげます。
    • チェックなし:クラスターでのイベント ログ監視は無効となります。
      • クラスター追加:こちらを選択すると、クラスター追加の際に検出したノード内で、イベント ログ監視は有効になりません。ノードがすでに存在すれば、サーバーのイベント ログ ステータスを、そのまま維持します。
      • クラスター更新:こちらを選択すると、クラスター更新時に全サーバーとクラスターでイベント ログ監視は無効となります。また、サーバーとクラスターのすべてでデータベースからアラート・イベント関連のイベント ログをクリアします。このオプションは、必要な場合のみ指定してください。
  9. ポーリング間隔を入力してください(分)。

  10. 監視を関連付ける監視グループを、コンボボックスで選択します(任意項目)。

  11. 監視の追加をクリックしてください。

監視対象のパラメーター

Applications ManagerのWindowsクラスター監視では、クラスター詳細、クラスター ノード、リソース グループ、クラスターのパフォーマンス、ネットワーク、ディスク利用率、ストレージの統計などをサポートしています。イベント ログ ルールを設定し、クラスター イベントを監視することも可能です。

 

Windowsクラスターの監視詳細は図表で提示し、パラメーターが容易に理解可能です。監視する属性にしきい値を設定し、しきい値違反の際は関連付けたアクションでの通知もできます。クラスター内でフェールオーバーが発生したときも、通知可能です。

 

可用性タブでは、過去24時間か30日の可用性履歴がわかります。パフォーマンス タブでは、過去24時間か30日のステータスとイベントがわかります。リスト ビューでは、一括管理設定が可能です。リストにあるそれぞれの監視をクリックすると、次の情報が提示されます。

 

Windowsクラスターで監視対象となる属性は、Applications Managerでは次のタブに分類されています。

概要

パラメーター 説明
クラスター詳細

クラスター名/IPアドレス

クラスターの名前かIPアドレスです。

クォーラム所有者ノード クォーラム リソースを所有しているノードの名前を示します。
クォーラム パス クォーラム ファイルへのパスです。
クォーラム タイプ 現在のクォーラム タイプを示します。次の値がありえます。
  • 入力オブジェクト
  • クラスター
  • ディスクのみ
  • ノードおよびディスク マジョリティ
  • ノードおよびファイル共有マジョリティ
  • ノード マジョリティ
ノード数 クラスター内のノード総数を指します。
最大ノード クラスターに参加できる最多ノード数を指します。
ネットワーク数 サーバー クラスターが通信に利用する通信の数です。
オンライン リソース 現在オンラインのリソースを指します。
オフライン リソース 現在オフラインのリソースを指します。
オンライン リソース グループ 現在オンラインのリソース グループを指します。
オフライン リソース グループ 現在オフラインのリソース グループを指します。
利用中のディスク クラスターで利用中のディスクの数です。
ノード数 クラスター内のノード総数を表します。
ディスク利用率

ディスク利用率

クラスター内で利用中の総ディスク スペースを示します(%)。
ディスク空き比率 クラスター内で未使用の総ディスク スペースを示します(%)。
ディスク サイズ 総ディスク スペース(MB)。
利用ディスク ディスク総利用済みスペース(MB)。
空きディスク ディスクで利用できる総空きスペース(MB)。
ノード
ノード名 ノードを指名するラベルを指定します。
ステータス

ノードの現在のステータスを表します。ノードのステータスには、以下のものがあります。

  • アップ:ノード物理的に電源接続され、スイッチはオン、ブート済み、プログラム実行可能です。
  • ダウン:ノードは電源オフか、動作していません。
  • 参加中(Joining):ノードはクラスターへの参加手続き中です。
  • 停止中(Paused):ノードは稼働していますが、クラスターのオペレーションに関与していません。
  • 不明(Unknown):オペレーション失敗です。
リソース コントロールとマルチキャスト要求応答
未処理メッセージ 内部メッセージ キューの長さを表します(length、メッセージ数)。
RHSプロセス ノードで実行中のリソース ホスト監視プロセスの数を示します(Resource Hosting Sybsystem)。
RHS再起動 当該ノードで発生したリソース ホスト監視失敗の件数を表します。
ネットワーク再起動
再接続数 TCP接続が切断・再確立された回数を表します。


パフォーマンス

パラメーター 説明
マルチキャスト要求応答
未処理メッセージ 内部メッセージ キューの長さを表します(length、メッセージ数)。
リソース コントロール マネージャー
RHSプロセス ノードで実行中のリソース ホスト監視プロセスの数を示します(Resource Hosting Sybsystem)。
RHS再起動 当該ノードで発生したリソース ホスト監視失敗の件数を表します。
ネットワーク再起動

 

ノード名 ノードを区別するためのラベルです。
再接続数 TCP接続が切断・再確立された回数を表します。
正常メッセージ キュー長 キュー内で送信を待期しているメッセージの数を示します(length、メッセージ数)。
正常メッセージ キュー長の差分(Delta) キューに追加されるメッセージの件数を指します(length、メッセージ数)。
緊急メッセージ キュー長 キュー内で送信を待期している緊急メッセージの数を示します。
緊急メッセージ キュー長の差分(Delta) キューに追加されるメッセージの件数を指します(length、メッセージ数)。
リソース タイプ統計
リソース失敗 リソース ホスト監視が、リソース失敗で停止した回数を表します。
リソース失敗アクセス違反 リソース ホスト監視が、アクセス違反によるリソース失敗で停止した回数を表します。
リソース失敗デッドロック リソース ホスト監視が、デッドロックによるリソース失敗で停止した回数を表します。

ネットワーク

パラメーター 説明
名前 ネットワークの名前を示します。
アドレス ネットワーク全体のアドレスかサブネットを示します。
役割 ネットワークの役割プロパティを示します。たとえば、クラスターにあるネットワークのプロパティなどです。次の値がありえます。
  • なし:クラスターがネットワークを利用していません。
  • クラスター:ネットワークはクラスター内部通信に利用されます。
  • クライアント:ネットワークはクライアント システムからクラスターへの接続に利用されます。
  • 双方:ネットワークはクライアント システムの接続にも、クラスター内部通信にも利用されます。
ステータス ネットワーク現在のステータスを示します。次の値がありえます。
  • 不明(Unknown):オペレーション失敗です。
  • 利用不能(Unavailable):ネットワークの全インターフェースが利用不能です。ネットワーク インターフェースのあるノードがダウンしています。
  • ダウン:ネットワークが稼働していません。ネットワーク上に、通信できるノードがありません。
  • パーティション化(Partitioned):ネットワークは稼働していますが、複数ノードが通信不能です。接続固有の問題が考えられます。
  • アップ:ネットワークは稼働中です。クラスター内の全ノードと通信できます。
ネットワーク メッセージ
受信バイト 「バイト受信/秒」パフォーマンス カウンターは、ネットワークが1秒ごとに受け取る新規クラスター メッセージのデータ量を表します。
送信バイト 「バイト送信/秒」パフォーマンス カウンターは、ネットワークへ1秒ごとに送り出される新規クラスター メッセージのデータ量を表します。
受信メッセージ 「メッセージ受信/秒」パフォーマンス カウンターは、ネットワークが1秒ごとに受信する新規クラスター メッセージの数を表します。
送信メッセージ 「メッセージ送信/秒」パフォーマンス カウンターは、ネットワークへ1秒ごとに送り出される新規クラスター メッセージの数を表します。

記憶域

パラメーター 説明
パス クラスター化したディスク パーティションのパスを表します。ドライブ文字がある場合はそれも含みます。
ボリューム ラベル パーティションのボリューム ラベル プロパティを表します。
サイズ パーティションの総容量を表します(MB)。
利用済み パーティションの総利用スペースです(MB)。
空き パーティションで利用可能な総空きスペースです(MB)。
利用率 パーティションの利用スペース比率を表します(%)。
空き比率 パーティションの空きスペース比率を表します(%)。

リソース グループ

パラメーター 説明
名前 リソース グループの名前です。
現在のノード リソース グループを実行中のノードです。
優先ノード リソース グループがクラスターでフェールオーバー/フェールバック先にできる、優先ノードの名前を示します。
ステータス リソース グループの現在のステータスです。ステータスは次のものがあります。
  • 不明(Unknown)
  • オンライン
  • オフライン
  • 失敗(Failed)
  • 一部オンライン(PartialOnline)
  • 保留(Pending)

イベント

パラメーター 説明
役割名
Windowsクラスター イベント ログ ルールの名前です。
ログ ファイル タイプ イベント ログ ルール作成の根拠となる、ログ ファイル タイプです。Windowsクラスター イベントは「システム」ログ ファイルに作成されますが、Applications Managerユーザーは「クラスター」のルールを、どのログ ファイル タイプにも「作成」可能です。これにより、同一クラスター レベルのすべてのサーバーで、他の場所で作成されたイベントを確認できます。
ノード名 イベント発生元のWindowsクラスター ノードの名前です。
ソース イベント ログに関連付いたソースを示します。
イベントID イベント ログに関連付いたIDを示します。
タイプ イベント タイプ:全タイプ、エラー、警告、情報です。メモ:セキュリティ イベントの場合、監査成功、監査失敗となります。
説明 イベント発生時に、こちらに説明が入ります。
生成時刻 イベント発生時刻を指します。