Hadoop監視
Hadoopは,オープン ソースのソフトウェア フレームワークです。ビッグ データの分散ストレージと分散処理むけにデザインされています。Hadoopの主要アーキテクチャは、ストレージ部分と処理部分でできています。Hadoopはファイルを大きなブロックに分け,クラスター内ノードに分散させます。Hadoopは複数ノードにタスクを渡して並列処理を実行、データのローカル性を活かして高速かつ効率的に動作します(データはノードで集中処理され、やりとり遅延がありません)。Applications ManagerのHadoop監視では、Hadoop 1.xとHadoop 2.xの双方をサポート。Hadoop分散クラスターのステータス維持や、可用性の確保、タスクの高速・精密実行に役立ちます。
Hadoop監視を作成するには、次の手順に従ってください。
- 新規監視をクリックし、サービスからHadoopを選択します。
- 監視の表示名を入力してください。
- 監視のモードを選択します。
REST APIモードの場合:
- 監視するHadoopのバージョンを指定します。
- NameNodeのホストを指定します。
- NameNodeのWebポートを指定します。
- YesかNoで、SSLは有効か選択ください。
- 認証タイプを選択します。シンプル認証を選択する場合、ユーザー名を指定してください。
- リソース マネージャー ホストの名前を指定します。
- リソース マネージャーのWebポートを指定します。
- もう1度、YesかNoで、SSLは有効か選択ください。
- もう1度、認証タイプを選択します。シンプル認証を選択する場合、ユーザー名を指定してください。
- ポーリング間隔を指定します。
- コンボボックスで、監視を関連付ける監視グループを選択します(任意項目)。監視は複数グループに関連付け可能です。
- 監視の追加をクリックします。これによって、ネットワークから監視を検出し、監視を始めます。
- NameNodeのホストを指定します。
JMXモードの場合:
- 監視するHadoopのバージョンを指定します。
- NameNodeのホストを指定します。
- NameNodeのJMXポートを指定します。
- ユーザー名とパスワードを入力してください。
- NameNodeのJNDIパスを入力してください。
- リソース マネージャー ホストの名前を指定します。
- リソース マネージャーJMXポートを指定します。
- ユーザー名を入力し、パスワードをセットします。
- リソース マネージャーのJNDIパスをセットします。
- ポーリング間隔をセットします。
- コンボボックスで、監視を関連付ける監視グループを選択します(任意項目)。監視は複数グループに関連付け可能です。
- 監視の追加をクリックします。これによって、ネットワークから監視を検出し、監視を始めます。
- NameNodeのホストを指定します。
Hadoopサーバー:監視対象のパラメーター
監視タブをクリックして、監視カテゴリ ビューへ移動してください。サービス テーブルでHadoopを選ぶと、Hadoop一括設定ビューが3つのタブに分類・表示されます。
- 可用性タブでは、過去24時間か30日の可用性履歴がわかります。
- パフォーマンス タブでは、過去24時間か30日のステータスとイベントがわかります。
- リスト ビューでは、一括管理設定が可能です。
管理名をクリックすると、全サーバーの詳細が、以下のタブに表示されます。
Hadoop 1.x
セーフ モード | |
---|---|
セーフ モード ステータス |
セーフ モード ステータス ステータスには次のものがあります。 -Operational -Safemode |
DFS | |
総DFS容量(GB) | HDFSの総容量です。 |
非DFS利用済みスペース(GB) | DFSコマンドを使わず利用されているHDFSメモリを指します。 |
DFS利用済みスペース(GB) | DFSコマンドで利用されているHDFSメモリを指します。 |
利用済みDFS(%) | HDFSメモリの利用率を示します(%)。 |
DFS空きスペース(GB) | HDFSの空きメモリです。 |
DFS空き(%) | HDFSの空きメモリ比率を表します(%)。 |
ブロック | |
ブロック容量 | Hadoopの総ブロック容量です。 |
総ブロック | Hadoopにあるブロックの総数です。 |
欠落ブロック | Hadoopに欠落ブロックがいくつあるかを表します。 |
破損ブロック | Hadoopに破損ブロックがいくつあるかを表します。 |
過剰ブロック | Hadoopに過剰ブロックがいくつあるかを表します。 |
複製不足のブロック | Hadoopに複製不足のブロックがいくつあるかを表します。 |
削除保留ブロック | Hadoopに削除保留ブロックがいくつあるかを表します。 |
複製保留ブロック | Hadoopに複製保留ブロックがいくつあるかを表します。 |
ファイル | |
総ファイルとディレクトリ | HDFSにあるファイルとディレクトリの総数を示します。 |
ファイル/ディレクトリ作成(/秒) | ファイルやディレクトリの作成ペースを指します(数/秒)。 |
負荷 | |
総負荷 | Hadoopサービスへの総負荷を示します。 |
NameNode JVM | |
---|---|
コミット済み非ヒープ メモリ | 現在、利用してよいものとコミットされている総非ヒープ メモリを示します。 |
利用済み非ヒープ メモリ | Currently used非ヒープ メモリ. |
コミット済みヒープ メモリ | 現在、利用してよいものとコミットされている総ヒープ メモリを示します。 |
利用済みヒープ メモリ | 利用中のヒープ メモリを指します。 |
NameNode OS | |
総物理メモリ(GB) | NameNodeの総RAMです。 |
空き物理メモリ(GB) | NameNodeの空きRAMです。 |
総スワップ スペース(GB) | NameNode OSで利用できるスワップ総容量を表します。 |
空きスワップ スペース(GB) | NameNode OSで利用できる空きスワップ スペースを表します。 |
最大ファイル デスクリプター数 | 総ファイル デスクリプター容量 |
オープンファイル デスクリプター数 | ステータスがオープンのファイル デスクリプターの数です。 |
平均システム負荷 | NameNode OSでの平均負荷を表します。 |
DataNode | |
ノード名 | DataNodeの名前です。 |
ステータス | NameNodeの現在のステータスを指します。
|
利用済みスペース(GB) | HDFSで利用中のスペースを指します。 |
トラッカーサマリ | |
---|---|
総TaskTracker | TaskTrackerの総数です。 |
アライブTasktracker | ステータスがアライブのTaskTrackerの数を示します。 |
ブラック リスト入りTaskTracker | ブラック リストにあるTaskTrackerの数を示します。 |
グレイリスト入りTaskTracker | グレイリストにあるTaskTrackerの数を示します。 |
ジョブ総数 | MapReduceで実行したジョブの総数です。 |
スロット サマリ | |
総mapスロット | MapReduceでの総mapスロット容量を表します。 |
利用済みmapスロット | 利用中のmapスロットの数を示します。 |
総reduceスロット | MapReduceでの総reduceスロット容量を表します。 |
利用済みreduceスロット | 利用中のreduceスロットの数を示します。 |
TaskTracker | |
TaskTracker名 | タスクtrackerの名前です。 |
ステータス | TaskTrackerの現在のステータスです。
|
正常性 | TaskTrackerの現在の正常性です。
|
失敗数 | TaskTrackerでの失敗の数を表します。 |
キュー | |
キュー名 | キューの名前です。 |
ステータス | キューの現在のステータスです。 |
情報 | キューからのあらゆるエラー情報です。 |
ジョブ サマリ | |
---|---|
送信済みジョブ | ステータス「submitted」のジョブの数を表します。 |
準備中ジョブ | ステータス「preparing」のジョブの数を表します。 |
実行中ジョブ | ステータス「running」のジョブの数を表します。 |
失敗ジョブ | ステータス「failed」のジョブの数を表します。 |
強制終了ジョブ | ステータス「killed」のジョブの数を表します。 |
完了ジョブ | ステータス「completed」のジョブの数を表します。 |
完了率(%) | 完了したジョブの比率を表します(%)。 |
強制終了率(%) | 強制終了したジョブの比率を表します(%)。 |
失敗率(%) | 失敗したジョブの比率を表します(%)。 |
ジョブ統計(最新ポーリング間隔) | |
送信済みジョブ数 | ポーリング間隔に送信されたジョブの数を表します。 |
失敗ジョブ数 | ポーリング間隔に失敗ジョブの数を表します。 |
強制終了ジョブ数 | ポーリング間隔に強制終了されたジョブの数を表します。 |
完了ジョブ数 | ポーリング間隔に完了したジョブの数を表します。 |
Hadoop 2.x
セーフ モード | |
---|---|
セーフ モード ステータス |
セーフ モード ステータス ステータスには次のものがあります。 -Operational -Safemode |
DFS | |
総DFS容量(GB) | HDFSの総容量です。 |
非DFS利用済みスペース(GB) | DFSコマンドを使わず利用されているHDFSメモリを指します。 |
DFS利用済みスペース(GB) | DFSコマンドで利用されているHDFSメモリを指します。 |
利用中のDFSを指します(%)。 | HDFSメモリの利用率を示します(%)。 |
DFS空きスペース(GB) | HDFSの空きメモリです。 |
DFS空き(%) | HDFSの空きメモリ比率を表します(%)。 |
ブロック | |
ブロック容量 | Hadoopの総ブロック容量です。 |
総ブロック | Hadoopにあるブロックの総数です。 |
欠落ブロック | Hadoopに欠落ブロックがいくつあるかを表します。 |
破損ブロック | Hadoopに破損ブロックがいくつあるかを表します。 |
過剰ブロック | Hadoopに過剰ブロックがいくつあるかを表します。 |
複製不足のブロック | Hadoopに複製不足のブロックがいくつあるかを表します。 |
削除保留ブロック | Hadoopに削除保留ブロックがいくつあるかを表します。 |
複製保留ブロック | Hadoopに複製保留ブロックがいくつあるかを表します。 |
ファイル | |
総ファイルとディレクトリ | HDFSにあるファイルとディレクトリの総数です。 |
ファイル/ディレクトリ作成(/秒) | ファイルやディレクトリの作成速度を示します(数/秒)。 |
負荷 | |
総負荷 | Hadoopサービスへの総負荷を示します。 |
DataNodeサマリ | |
---|---|
ライブDataNode | ステータス「live」のDataNodeの数を示します。 |
デッドDataNode | ステータス「dead」のDataNodeの数を示します。 |
ライブ廃棄済みDataNode | DataNodeのうち、ライブでありながら廃棄されている(decomissioned)ものの数を示します。 |
デッド廃棄済みDataNode | DataNodeのうち、デッドであり、かつ、廃棄されている(decomissioned)ものの数を示します。 |
廃棄DataNode | ステータス「decomissioned」のDataNodeの数です。 |
古いDataNode | ステータス「stale」のDataNodeの数を示します。 |
ライブDataNode率(%) | ステータス「live」のDataNode比率を表します(%)。 |
デッドDataNode率(%) | ステータス「dead」のDataNode比率を表します(%)。 |
DataNode | |
ノード名 | DataNodeの名前です。 |
ステータス | DataNodeの現在のステータスを表します。
|
総容量(GB) | HDFSの総容量です。 |
利用済み非DFS(GB) | 非HDFSコマンドで利用されたHDFSメモリの量を指します。 |
利用済みDFS(GB) | HDFSコマンドで利用されたHDFSメモリの量を指します。 |
DFS利用率(%) | HDFSコマンドで利用されたHDFSメモリ比率を表します(%)。 |
DFS空き(GB) | HDFSにある空きメモリの量を示します。 |
DFS空き比率(GB) | HDFSにある空きメモリの比率を表します(%)。 |
NodeMangerサマリ | |
---|---|
アクティブNodeManager | ステータス「active」のNodeManagerの数を示します。 |
廃棄済みNodeManager | ステータス「decommissioned」のNodeManagerの数を示します。 |
喪失NodeManager | ステータス「lost」のNodeManagerの数を示します。 |
異常NodeManager | ステータス「unhealthy」のNodeManagerの数を示します。 |
リブート済みNodeManager | ステータス「rebooted」のNodeManagerの数を示します。 |
アクティブNodeManager率(%) | ステータス「active」のNodeManagerの比率を表します(%)。 |
喪失NodeManager率(%) | ステータス「lost」のNodeManagerの比率を表します(%)。 |
異常NodeManager率(%) | ステータス「unhealthy」のNodeManagerの比率を表します(%)。 |
NodeManager | |
ホスト名 | NodeManagerのホスト名です。 |
ラック | NodeManagerのあるラックを指します。 |
ステータス |
NodeManagerの現在のステータスです。
|
利用済みメモリ(%) | NodeManagerが利用しているメイン メモリの比率を表します(%)。 |
バージョン | NodeManagerのバージョンを指します。 |
アプリケーション | |
---|---|
送信済みアプリケーション | ステータス「submitted」のアプリケーションの数です。 |
完了アプリケーション | ステータス「completed」のアプリケーションの数です。 |
保留中アプリケーション | ステータス「pending」のアプリケーションの数です。 |
実行中アプリケーション | ステータス「running」のアプリケーションの数です。 |
失敗アプリケーション | ステータス「failed」のアプリケーションの数です。 |
強制終了アプリケーション | ステータス「killed」のアプリケーションの数です。 |
完了率(%) | 完了アプリケーションの比率を表します(%)。 |
強制終了率(%) | 強制終了アプリケーションの比率を表します(%)。 |
失敗率(%) | 失敗アプリケーションの比率を表します(%)。 |
アプリケーション統計(最新ポーリング間隔) | |
送信済みアプリケーション数 | ポーリング間隔に送信されたアプリケーションの数を表します。 |
失敗アプリケーション数 | ポーリング間隔に失敗したアプリケーションの数を表します。 |
強制終了アプリケーション数 | ポーリング間隔に強制終了アプリケーションの数を表します。 |
完了アプリケーション数 | ポーリング間隔に完了したアプリケーションの数を表します。 |