Linux/UNIXサーバー監視
概要
ManageEngine® Applications Managerは標準でLinuxやUNIXのサーバー監視の機能を備えています。オペレーション チームはサーバーのアップをpingで確認できるだけでなく、CPU利用率、メモリ利用率、プロセス、ディスク利用率、ディスクI/O統計を監視して、サーバーをピーク パフォーマンスで稼働させることができます。
新規Linux監視を作成するには
- 監視のモードを選択します(Telnet、SSH、SNMP)。IBM AIX、HP-UX、Tru64 UNIXではTelnetとSSHのみをサポートします。Novell UNIXの場合は、SNMPのみがサポート対象です。
- Telnetの場合、サーバーのポート番号(デフォルトで23)と、ユーザー名・パスワードを入力してください。
- SSHの場合、サーバーのポート番号(デフォルトで22)と、ユーザー名・パスワードを入力してください。任意で公開鍵認証も可能です(ユーザー名と秘密鍵)。秘密鍵を守るためのパスフレーズも指定できます。
メモ:公開鍵や秘密鍵を探すには、コマンド プロンプトへ移動し、cd.SSHと入力して、リストからファイル<id_dsa.pub>/<id_rsa.pub>[Public]か、<id_dsa>/<id_rsa>[Private]を開いてください。
- SNMPの場合、実行ポート(デフォルトで161)とSNMPコミュニティ文字列(デフォルトで「public」)を指定します。ユーザー名とパスワードは不要です。
- 監視を関連付ける監視グループを、コンボボックスで選択します(任意項目)。
- 監視の追加をクリックすると、ネットワークからホストやサーバーを検出し、監視を始めます。
Telnet/SSHモードで監視するには、コマンド プロンプト値を指定してください(コマンド プロンプトの最後の文字)。デフォルトでは$となっており、>、#なども指定できます。
監視対象のパラメーター
Applications Managerは、LinuxサーバーのKPIを監視し、パフォーマンス低下を検知します。KPIにはCPU、メモリ、ディスクなどがあります。
- 可用性タブは、過去24時間か30日のLinuxサーバーの可用性履歴を示します。
- パフォーマンス タブでは、物理メモリ利用率、CPU利用率、応答時間、スワップ メモリ利用率など、LinuxサーバーのKPIを、これら属性のヒート チャートとあわせて表示します。過去24時間か30日のステータスとイベントも提示します。
- リスト ビュー タブでは、Applications Managerが監視するApplications Managerが監視するLinuxサーバーすべてを、その可用性とステータス全般とあわせて表示します。一括管理設定も可能です。
リストにあるそれぞれの監視をクリックすると、詳細なパフォーマンス メトリックが表示されます。パフォーマンス メトリックは、6つのタブに分類されています。
概要
このタブでは、Linuxサーバーのステータスとパフォーマンス全体像を、システムで実行中のプロセスやサービスの情報とあわせて提示します。
パラメーター | 説明 |
---|---|
監視情報 | |
名前 | Linuxサーバー監視の名前です。 |
システム ステータス | Linuxサーバー(クリア、警告、重大)のステータスを表します。 |
タイプ | 監視しているリソースのタイプを表します。 |
ホスト名 | Linuxシステムのホスト名です。 |
ホストOS | システムにインストールされているメインOSを指します。 |
最新ポーリング時刻 | 最新のポーリングを実行した時刻を指します。 |
次回ポーリング時刻 | 次回のポーリングをスケジュールした時刻を指します。 |
本日の可用性 | サーバーの当日分の可用性ステータス全般を示します。サーバーの7/30レポートと現在の可用性ステータスも表示できます。 |
パラメーター | 説明 |
---|---|
スレッド数 | Linuxマシンで実行中のスレッドの数を示します。 |
プロセス数 | プロセスの数です。起動プロセス数が多すぎるとサーバーのパフォーマンスが低下します。プロセス数が上昇し始めたら、問題発生前の予兆の段階で対処するよう警告をあげると有用です。 |
ゾンビ プロセス数 | ゾンビ プロセスの数です。ゾンビ プロセスは制御不能のままポートを空け続けることがあります。ゾンビ プロセスが発生したら確認し、問題発生前の予兆の段階で対応できるようにしておくと、有用です。 |
「監視情報」セクションのカスタム フィールドでは、監視に追加フィールドの設定が可能です。
概要タブでは、CPU、メモリ、ディスクの利用率ダイアルを表示します。ダイアルをクリックすると、属性の詳細が図表で表示されます。グラフは履歴レポート、時間帯別レポート、曜日別レポート、ヒート チャートでご利用いただけます。グラフは、リアルタイム データでも履歴データでも作成可能です。
CPUとメモリの利用率(最新6時間)グラフは、最新6時間のメモリ・CPU利用率を表示します。提示する属性は、スワップ メモリ利用率、物理メモリ利用率(%、MB)、CPU利用率(%)です。
CPU利用率の内訳グラフでは、システム プロセッサー全体のパフォーマンス メトリック内訳を、実行キュー、ブロックされたプロセス、ユーザー時間(%)、システム時間(%)、I/O待機時間(%)、アイドル タイム(%)、割り込み(数/秒)などの属性で示します。
システム負荷グラフでは、システムが実行する作業の量がわかります。最新1分・5分・15分のシステム負荷は、それぞれ1分間・5分間・15分間でのジョブなどのパラメーターで提示します。
プロセス詳細のセクションでは、Linuxサーバーで実行中のプロセスの情報が表示されます。プロセス監視の追加は、新規プロセスの追加オプションで可能です。不要なプロセスの削除や、プロセスごとのレポート有効化/無効化もできます。表示された属性をクリックすると、それぞれの情報がより詳しく表示されます。
当該システム内の監視のセクションでは、該当するサーバーに設定した監視の可用性とステータスがわかります。監視するリソースを追加するには、監視の追加をご利用ください。
CPU
このタブではLinuxサーバーのCPU利用率統計を表示します。タブには2種類のグラフがあります。1つはCPU利用率(コアごと)で、もう1つはCPU利用率の内訳(コアごと)です。追加レポートを表示するには、CPU利用率の内訳(コアごと)にあるグラフをクリックしてください。全コアのCPU利用率の内訳(%)、ユーザー時間(%)、システム時間(%)、I/O待機時間(%)、アイドル タイム(%)、CPU利用率(%)、割り込み(数/秒)がわかります。
CPUタブでは次のパフォーマンス メトリックも表示しています。
パラメーター | 説明 | 監視モード | |
---|---|---|---|
Telnet/SSH | SNMP | ||
コア | CPUコアの名前です。 | ||
ユーザー時間(%) | プロセッサーがユーザー モードの作業に費やした時間の割合を表します(%)。これは主に、アプリケーション コードの負荷を指します。 | ||
システム時間(%) | 利用中のCPUカーネル プロセスの割合を表します(%)。 | ||
I/O待機時間(%) | プロセッサーがI/O処理完了を待機していた時間を表します。 | ||
アイドル タイム(%) | CPUがアイドルの時間です。どのプログラムもCPUを使っていない状態を表します。 | ||
CPU利用率(%) | システムが利用しているCPU総量を示します。 | ||
割り込み/秒 | CPUがアプリケーションやハードウェアからの割り込みに対応する、ペースを指します(数/秒)。割り込みの値が定常的に高い場合は、ハードウェアの問題が考えられます。 |
これら属性のグラフを表示するには、CPUコアを選び、続いて属性を選択ください。
ディスク
このタブでは、Linuxサーバーによるディスクの利用率とディスクI/Oの統計を表示します。
パラメーター | 説明 |
---|---|
ディスク利用率 | |
ディスク | ディスク ドライブの名前です。 |
利用済み(%) | 総ディスク スペースのうち実際に利用されている量の比率を表します(%)。 |
利用済み(MB) | 利用中のディスク スペースを指します(MB)。 |
空き(%) | 空きヒープ メモリの割合を表します(%)。 |
空き(MB) | ディスクに存在する未割り当てのスペースを指します(MB)。 |
ディスクI/O統計 | |
転送/秒 |
|
書き込み/秒 | ディスク ドライブが書き込みリクエストへの対応でビジーであった時間の比率を指します(%)。 |
読み込み/秒 | ディスク ドライブが読み込みリクエストへの対応でビジーであった時間の比率を指します(%)。 |
ビジー時間(%)[% Busy Time] | ディスクがビジーであった時間の割合を表します(%)。 |
平均キュー長 | サンプル期間中、ディスク向けにキューイングされていた読み書き双方のリクエスト数平均を指します。 |
inode利用率 | |
inode | inodeの名前です。 |
合計 | inode特定ディスクに存在するの総数です。 |
利用 | ディスク ドライブが読み込みリクエストへの対応でビジーであった時間の比率を指します(%)。 |
空き | 特定ディスクに残存しているinodeの数を表します。 |
利用済み(%) | 特定ディスクで利用中のinodeの数です。(%)。 |
空き(%) | 特定ディスクに残存しているinodeの数を表します(%)。 |
物理的に取り外したディスクの削除も、孤立したディスクの削除で可能です。
メモ:ディスクI/Oとinodeの統計データ収集を有効にするには、「ディスクI/O統計監視」と「inode監視」を、管理 > パフォーマンス ポーリング >サーバー タブで有効にしてください。
cronジョブ
cronジョブはLinuxで、バックアップ、メール、ステータス チェックなどのタスクのスケジュールに利用されます。Webサーバーやアプリケーションのパフォーマンスに、重大なインパクトがあることも珍しくありません。Applications Managerの利用でcronの継続監視は容易となり、バックエンド システムでの重要ジョブ実行状況がわかります。
cronジョブ監視を追加する
要件:当社製品要件の該当機能の解説をご確認ください。
- cronジョブ タブへ移動し、cronジョブの追加をクリックしてください。
- 次の詳細を入力してください。
- 表示名:ユーザーにわかりやすい名前をつけます。
- cron式:cronジョブのスケジュール設定に使う表現です。
- タイムゾーン:リモートLinuxマシンに設定したタイムゾーンで、ドロップダウンから選択できます。
- ジョブ スクリプト パス:cronジョブ実行に必要なスクリプトの完全パスです。
- cronジョブ期間:ジョブ完了までの許容時間です(分)。設定時間を超えると、ステータスは実行時間超過に更新されます。
- cronジョブ監視を追加すると、cronジョブの下にcurl情報が表示されます。クリックでcurl情報をコピーできますので、そのち、ウィンドウを閉じてください。これによって、cronジョブ タブへ自動的にリダイレクトされます。
- リモートLinuxマシンで、コマンド プロンプトを開き、コマンドcrontab -eを実行します。これにより、crontabが編集モードで開きます。以前コピーしたcron情報を貼り付けてから、保存して閉じてください。
次の表では、Linuxサーバーで実行中のcronジョブの詳細を説明します。
パラメーター | 説明 |
---|---|
cronジョブ詳細 | |
cron名 | cronジョブの名前です。 |
cron式 | cronジョブに対応するcron式です。 |
ジョブ起動時刻 | cronジョブ開始の日時を表します。 |
ジョブ終了時刻 | cronジョブ終了の日時を表します。 |
次回実行時刻 | 次回cronジョブの実行をスケジュールした日時を示します。 |
経過時間 | cronジョブ開始以来のの経過時間です(分)。 |
終了コード | cronジョブの終了コードを表します。 |
実行失敗 | cronジョブがスケジュール時刻に実行失敗した回数を指します。 |
ステータス | cronジョブのステータスです。ステータスは次のものがあります。
|
メモ:cronジョブを追加すると、リモート サーバーから最初のレスポンスがあるまで、ディスカバリ中のステータスとなります。
cronジョブを更新するには
cronジョブを更新するには、次の手順で操作します。
- cronジョブのアイコンを選び、編集をクリックします。
- cronジョブの表示名とcronジョブ期間を入力してください。
- 更新をクリックします。
cronジョブを削除する
cronジョブを削除するには、
- 削除するcronジョブを選択してください。
- cronジョブの削除をクリックします。これによりApplications Managerからcronジョブが削除されます。
- 最後に、リモート サーバーのcronジョブに追記(append)したcurlを、crontab -eコマンドで削除してください。
メモ:cronジョブの追加、更新、削除は、管理者により、管理対象サーバーにのみ実行可能です。
ネットワーク(SNMPモードのみ)
ネットワーク インターフェース
パラメーター | 説明 |
---|---|
ネットワーク インターフェース | |
名前 | Linuxシステムに存在するネットワーク インターフェースの名前です。 |
速度(MB/秒) | 現在の推定帯域を示します(MB/秒)。 |
受信トラフィック(KB/秒) | インターフェースでのパケット受信速度をデータ量で表します(KB/秒)。 |
送信トラフィック(KB/秒) | インターフェースでのパケット送信速度をデータ量で表します(KB/秒)。 |
エラー | 送受信できなかったパケットの数を指します。 |
メモ
- ネットワーク インターフェース詳細は、SNMPモードで追加したLinuxリソースでのみ監視できます。
- 物理的に取り外したインターフェースは、孤立したインターフェースの削除で削除できます。
設定
このタブではシステム設定属性の情報を表示します。
パラメーター | 説明 |
---|---|
システム情報 | |
ホスト名 | システムの名前です。 |
ドメイン | システム所属先のドメインの名前です。 |
OS情報 | |
OS名 | OSインスタンスの名前です。 |
OSバージョン | OSのバージョン番号です。 |
OSリリース | Linuxディストリビューションを指します。 |
メモリ情報 | |
総物理メモリ(MB) | OSで利用できる物理メモリの総量です。 |
総スワップ メモリ(MB) | 利用できるスワップ メモリの総量です。 |
プロセッサー情報 | |
ID | システムにあるプロセッサーの一意の識別子です。 |
モデル | プロセッサー モデルタイプを指します。 |
インプリメンテーション | プロセッサー ファミリー タイプを指します。 |
製造者 | プロセッサー製造者の名前です。 |
速度(MHz) | プロセッサーの現在の速度です。 |
キャッシュ(KB) | プロセッサー キャッシュのサイズです。メイン メモリよりアクセスの速い外部メモリを指します。 |
ネットワーク インターフェース設定 | |
名前 | ネットワーク アダプターの名前です。 |
IPアドレス | 当該ネットワーク インターフェースに設定されているIPアドレスを指します。 |
MTU | 利用中のネットワーク メディアのタイプです。 |
タイプ | ネットワーク アダプターのタイプです。 |
MACアドレス | ネットワーク アダプターのMACアドレスを指します。MACアドレスは一意の48ビットの数値で、ネットワーク アダプターに製造者が割り振ります。ネットワーク アダプターの特定や、TCP/IP通信へのマッピングに使われます。 |
ステータス | ネットワーク アダプターの現在のステータスです。 |
ブロードキャ ストア ドレス | メッセージのブロードキャスト先IPアドレスです。 |
プリンター設定 | |
名前 | プリンターの名前です。 |
装置 | プリンターを制御するサーバーの名前です。 |
デフォルト | プリンターがデフォルトのものかを示します。値はTrueかFalseです。 |
ステータス | プリンターの現在のステータスです。 |
メモ:設定タブにある情報は、ポーリングのたびに更新されるわけではありません。サーバー設定を変更した場合、変更をただちに「設定」タブに反映させるには、Applications Managerを再起動してください。
ハードウェアのメトリック
以下、DellとHPのサーバー製品にかかわるハードウェア メトリックを説明します。
カテゴリ | 属性 | 説明 | Dell | HP | ||
---|---|---|---|---|---|---|
SNMPモード | WMIモード | SNMPモード | WMIモード | |||
温度 | センサー | 温度センサーの名前です。 | ||||
温度読み込み(摂氏) | 現在の温度読み込み | |||||
ステータス | 温度のステータスを指します(重大、警告、クリア)。 | |||||
ファン | センサー | ファン センサーの名前です。 | ||||
ファン速度(RPM) | ファン回転速度を表します(分ごと回転数:Rounds per Minute)。 | |||||
ステータス | ファンのステータスを指します(重大、警告、クリア)。 | |||||
電源 | センサー | 電源の名前です。 | ||||
読み込み(ワット) | 電源読み取り値を表示します(ワット)。 | |||||
ステータス | 電源のステータスを指します(重大、警告、クリア)。 | |||||
電圧 | センサー | 電圧供給の名前です。 | ||||
読み込み(ボルト) | 電圧読み取り値を表示します(ボルト)。 | |||||
ステータス | 電圧のステータスを指します(重大、警告、クリア)。 | |||||
バッテリ | センサー | バッテリ センサーの名前です。 | ||||
ステータス | バッテリのステータスを指します(重大、警告、クリア)。 | |||||
メモリ | センサー | メモリ センサーの名前です。 | ||||
メモリ装置タイプ | メモリ装置のタイプです。 | |||||
サイズ(MB) | 現在インストールされているメモリの量を指します(MB)。 | |||||
ステータス | メモリのステータスを指します(重大、警告、クリア)。 | |||||
ディスク | センサー | ディスク ラベルを識別できます。 | ||||
装置名 | ディスクに設定した装置名を指します。 | |||||
サイズ(MB) | 割り当てサイズを示します(MB)。 | |||||
ステータス | ディスク ステータスを表します(重大、重要、クリア)。 | |||||
アレイ | センサー | アレイ ディスクの名前です。 | ||||
バス プロトコル | アレイ ディスクのバスタイプを指します。 | |||||
サイズ(MB) | アレイ ディスクの利用量を指します(MB)。 | |||||
ステータス | アレイのステータスを指します(重大、警告、クリア)。 | |||||
シャーシ | センサー | ユーザーがシャーシに付けた名前です。 | ||||
モデル | シャーシのシステム モデルタイプです。 | |||||
ステータス | シャーシのステータスを指します(重大、警告、クリア)。 | |||||
プロセッサー | センサー | プロセッサー装置ステータス プローブのロケーション名です。 | ||||
プロセッサー ブランド | プロセッサー装置のブランドです。 | |||||
プロセッサー現在の速度 | プロセッサー装置の現在の速度です(MHz)。 | |||||
プロセッサー コア数 | プロセッサー装置で検出したコアの数を指します。 | |||||
ステータス | プロセッサー ステータスを表します(重大、警告、クリア)。 |
- コンポーネントが正しく機能していれば、ステータス インジケーターは緑です。
- システム コンポーネントがパフォーマンスしきい値を超過したり、適切に機能していない場合、ステータス インジケーターはオレンジか赤に変わります。一般的に、インジケーターがオレンジとなるのは、パフォーマンス低下の際です。
- インジケーターが赤であれば、コンポーネントは停止しているかしきい値を超過しています。
- ステータスが空白であれば、コンポーネントのステータスを判定できない状態です。
メモ:現在、ハードウェア パフォーマンス監視は、SNMPモードとWMI監視モードでサポートしています。
ハードウェア装置レベル設定
詳細ページ右側のホスト詳細にあるハードウェア設定では、監視する各種のハードウェア コンポーネントを選択できます。この操作は、管理タブのパフォーマンス ポーリング空も可能で、管理タブではハードウェア統計をグローバルに設定いただけます。
詳細設定
詳細ページ右側のホスト詳細から詳細設定をクリックすると、サーバーのパフォーマンス データ収集ページへ移動できます。
ハードウェア ステータス監視では、サーバーのハードウェア監視を有効・無効にできます。表示されるハードウェア コンポーネントも、選択して監視可能です(電源、ファン、ディスクなど)。こちらでの設定は、ハードウェア監視にグローバルに反映されます。値をそれぞれのテキスト ボックスで定義して、ステータス設定もできます。
- 重要度「重大」:ステータスが、重要度「重大」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスを重大と表示します。デフォルトでは、サーバー ハードウェアのメーカーが定義する故障、エラー、障害、回復不能、致命的上限、致命的下限、回復不能下限、致命的(failed、error、failure、nonRecoverable、criticalUpper、criticalLower、nonRecoverableLower、critical)を、Applications Managerの「重大(critical)」にマッピングします。
- 重要度「警告」:ステータスが、重要度「警告」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスを警告と表示します。デフォルトでは、サーバー ハードウェアのメーカーが定義する性能低下、警告、非致命的、非致命的下限、回復不能上限、非致命的下限(degraded、warning、nonCritical、nonCriticalUpper、nonRecoverableUpper、nonCriticalLower)を、Applications Managerの「警告(warning)」にマッピングします。
- 重要度「クリア」:ステータスが、重要度「クリア」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスをクリアと表示します。デフォルトでの設定値は「OK」です。
メモ:装置のステータスが、重要度のテキスト ボックスの指定値にマッチしなければ、装置ステータスは不明と表示されます。重要度に指定するステータス値は、カンマ区切りで、大文字小文字を区別します。