サーバー監視
概要
ネットワーク レベルの管理では、ステータスと接続の全体像を鳥瞰的に維持する必要があります。ネットワークにあるマシンのステータスや、負荷レベル、利用効率を把握することは、過負荷やパフォーマンス低下に陥っているシステムを特定し、是正を可能とするうえで最重要です。他方で、サーバー レベルの管理では、地に足の着いた業務が必要で、多大な手動作業、人力、管理業務が必要となります。Applications Managerのサーバー監視機能では、このような目標の達成と、ホストの設定管理が容易になります。
対応OS
- Windows
- Linux
- Sun Solaris
- IBM AIX(ページ スペース詳細)
- IBM AS/400(iSeries)
- HP-UX
- Tru64 UNIX
- FreeBSD
- Mac OS
- Novell UNIX ※SUSEではありません
新規サーバー監視を作成するには
サーバー監視を作成するには、次の手順に従ってください。
- 新規監視へ移動して、新規監視の追加をクリックします。サーバーのセクションで、必要なサーバー タイプを選択してください。
- ホストのIPアドレスか名前を入力してください。
- ネットワークのサブネット マスクを入力してください。
- 監視のモードを選択します(WMI/SNMP/SSH/Telnet)。
- 認証用のユーザー名とパスワードを入力するか、認証情報リストからの選択を有効にして、認証情報マネージャーから選択してください。
- ポーリング間隔を入力してください(分)。
- Enterprise EditionのAdminサーバーから新規監視を追加するには、Managedサーバーを選択します。
- 監視固有の認証情報を指定します。OSタイプを選択してください。Windowsでは、Windows NT、Windows XP、Windows Vista、Windows 7、Windows 8、Windows 10、Windows 2000、Windows 2003、Windows 2008、Windows 2012、Windows 2016、Windows 2019を、そのほか、Linux、Solaris、IBM AIX、IBM AS/400、HP-UX、Tru64 UNIX、FreeBSD、Mac OS、Novell UNIX、Windowsクラスターを選択できます。OSによって、利用できる「監視のモード」情報も変化します。
- コンボボックスから、監視グループに関連付けるサーバーを選択します(任意項目)。監視は複数グループに関連付け可能です。
- 監視の追加をクリックすると、ネットワークから必要なサーバーを検出し、監視を始めます。
サーバー監視の追加中に入力内容を間違った時は、問題の診断が可能です。問題の診断をクリックすると、pingテスト、ホスト詳細、監視モードなどのサーバー関連情報を表示するとともに、ホストごとの孤立したエントリを表でリストアップします。この情報は、WMI監視モードには適用されません。
監視対象のパラメーター
- 可用性タブでは、過去24時間か30日の可用性履歴がわかります。
- パフォーマンス タブでは、過去24時間か30日のステータスとイベントがわかります。
- リスト ビューでは、一括管理設定が可能です。
リストにある監視をそれぞれクリックすると、次の情報が表示されます。
パラメーター | 説明 |
---|---|
システム負荷 | システムが1/5/15分で処理したジョブの数を示します。ピーク値のほか、現在の値とステータスもわかります。 |
ディスク利用率 | システムが利用しているハード ディスク スペースを示し、ディスク パーティション パラメーターのピーク値や、現在の値とステータスの更新を行います(パラメーターには、WindowsではCやDなどのドライブ文字が、Linuxでは/homeなどのディレクトリが含まれます)。 |
メモリ利用率 |
|
ディスクI/O統計 | 装置ごとの読み書き速度を表します(数/秒)。 |
CPU利用率 | システムが利用しているCPU総量と、ピーク値、現在の値、現在のステータスを示します。 |
# 下記ドライブ文字のストレージは、サーバー監視で対象外となります。
am.disks.ignore=C
複数ディスクはカンマ区切りで指定します。Windowsの場合はC,Dなどとしてください。Linuxの場合は、/home/user1,/home/user2などの指定ができます。ただし、前方一致で判断するため、/home/userとだけ指定すれば、user1と2を含め全員が排除対象です。
以下、監視するパラメーターと監視のモードを表で示します。アイコンは、対応を表します。
有効にするには、このTelnetクライアントを使う権限を、管理者やオペレーターに付与してください。管理タブ > ユーザー管理 > 権限とクリックして、作業ください。
OS |
Telnet | SSH | SNMP | WMI |
---|---|---|---|---|
Windows | (Applications ManagerをWindowsにインストールした場合のみ) | |||
Linux | ||||
Solaris | ||||
HP-UX/Tru64 UNIX | ||||
FreeBSD | ||||
Mac OS | ||||
IBM AIX | ||||
Novell UNIX ※SUSEではありません | ||||
属性 | ||||
CPU利用率(Windows NT以外、すべて) | ||||
ディスク利用率(全タイプ) | ||||
物理メモリ利用率 (IBM AIXはrootユーザーのみ、WindowsはWMIモードのみ、その他は全タイプ) | ||||
スワップ メモリ利用率 (IBM AIXはrootユーザーのみ、FreeBSD、Linux、Solaris、Windows、Novell UNIX) | ||||
ネットワーク インターフェース(全タイプ) | (ステータス属性データは利用不法) | |||
プロセス監視(全タイプ) | ||||
プロセス監視:メモリ利用率(全タイプ) | ||||
プロセス監視:CPU利用率 (IBM AIX、FreeBSD、Linux、Mac OS、Solaris、HP-UX、Tru64) | ||||
サービス監視(Windowsのみ) | ||||
イベント ログ(Windowsのみ) | ||||
システム負荷(IBM AIX、FreeBSD、Linux、Mac OS、HP-UX、Solaris、Novell UNIX) | ||||
ディスクI/O統計 (only for IBM AIX、Linux、Solaris、Novell UNIX) | ||||
ディスクI/O統計 (IBM AIX、Linux、Solaris、Novell UNIX) | Windows Server監視参照 | |||
サーバー アップタイム (IBM AIX、FreeBSD、Linux、Mac OS、HP-UX、Solaris、Novell UNIX、Windows) |
メモ:設定の詳しい情報は、ホスト リソースのディスカバリ詳細を、データ収集の解説ページで確認いただけます。
AIXでは、ディスクI/O統計の平均キュー長はサポートしていません。 |
サーバー監視のモードには、SNMPよりTelnet/SSHを推奨します。
AIXサーバーでのページング スペース
AIXサーバーのページング スペース情報を取得するには、コマンド「lsps -a」を実行します。
「lspa -a」が表示するのは、ページング スペース論理ボリュームの現在の場所ではなく、過去の場所です。
通常、ページング スペースは、システムにあるプロセスが割り当てメモリ全体を使い果たし、メモリ スペースが枯渇した時に利用されます。実行中のプロセスが参照していないコードやデータは、ページング スペース エリアへと移され、プロセスが再びコードやデータを参照する際に、主メモリへ戻すこととなります。
AIXサーバーの監視中に、ページング スペースで「No data available」(データがありません)というエラーが出た場合、次の手順でトラブルシュートしてください。
はじめに、TelnetかSSHで接続します。
つづいて、コマンドlsps -aがシステムに存在するか調べ、実行してください。
ページング スペース特性を表示する
「lsps」コマンドは、ページング スペース名、物理ボリューム名、ボリューム グループ名、サイズ、ページング スペース利用率(%)、スペースはアクティブか非アクティブか、ページング スペースは自動にセットされているかなど、ページング スペース特性を表示します。各パラメーターは表示特性を示します。
以下、lspsコマンドでフラグを利用し、ページング スペース情報を表示する例を示します。「-c」フラグを立てると、コロン形式の情報と物理パーティションにあるページング スペースのサイズが表示されます。
# lsps -aのCLI出力イメージは次のとおりです。
Page Space | Physical Volume | Volume Group | Size | %Used | Active | Auto | Type |
---|---|---|---|---|---|---|---|
paging00 | hdisk1 | rootvg | 80MB | 1 | yes | yes | lv |
hd6 | hdisk1 | rootvg | 256MB | 1 | yes | yes | lv |
ページング スペースの追加とアクティベートには
OSでページング スペースを利用できるようにするには、まずページング スペースを追加し、つづいてそれを利用可能とする必要があります。システムがページングに利用できる総スペースは、アクティブなページング スペース論理ボリュームすべての合計サイズです。
これらコマンドの詳細は、こちらを参照ください。
上記のパラメーターとは別に、次の項目も監視できます。
- プロセス詳細からサーバー監視ページで、新規プロセスの追加をクリックします。
- 実行中のすべてのプロセスと、そのCPU・メモリの利用率統計が表示されます(メモリ統計は、WindowsをSNMPモードで監視する時のみサポートします)。
- 監視するプロセスを選択します。
設定したプロセスは、Windows監視ページのプロセス詳細に表示されます。プロセスをクリックすると、可用性のグラフが表示されます。特定プロセスにアラート設定も可能です。
特定プロセスを選んで表示名、プロセス名、コマンド、引数を編集するには、プロセスの編集アイコンをクリックしてください。
- Windows監視ページで、サービス詳細から新規サービスの追加をクリックします。
- 実行中のサービスが全て、サービス名やステータスとあわせ表示されます。
- 監視するサービスを選択します。
設定したサービスは、Windows監視ページのサービス詳細に表示されます。サービスをクリックすると、可用性のグラフが表示されます。特定サービスの可用性にアラート設定も可能です。
サービスの可用性監視のほか、サービスの起動、停止、再起動もできます。サービスのダウンに備え、「サービスの再起動」やその他のアクションを設定することも可能です。
メモ:Windowsサービス監視は、WMIモードで監視をしている場合のみ利用できます。
サーバー監視ページのネットワーク インターフェースでは、ネットワーク インターフェースすべてが表示されます。監視できる属性は次のとおりです。
- インターフェース トラフィック:受信トラフィック(ビット)、送信トラフィック (ビット)。これらの属性には、アラートしきい値の設定もできます。
- インターフェース利用率:受信利用率(%)と送信利用率(%)です。これらの属性には、アラートしきい値の設定もできます。
- 受信パケット:パケット受信速度です(数/秒)。
- 送信パケット:パケット送信速度です(数/秒)。
- エラー パケット:受信後のパケット エラーのレートです(数/秒)。
- 廃棄パケット:受信後のパケット廃棄のレートです(数/秒)。
- ステータス:インターフェースのステータスを属性を基準に示します。
- ステータス:インターフェースがアップかダウンか示します。SNMPでの監視の場合のみ表示されます。
スクリプトとURLのホスト リソースへの関連付け
スクリプトやURLのホスト リソースへの関連付けで、これらの属性データもホスト詳細に表示されるようになります。ホスト リソースのステータスは、スクリプトやURLのステータスに依存して決まることもあります。
たとえば、ASP.NETアプリケーションの要求実行時間、現在の要求、切断済みの要求パフォーマンス カウンターは、WMIで取得できるようになっています。Applications Manager標準機能ではこの情報は取得できませんが、情報を取得する自作スクリプトがあれば、そのままApplications Managerに設定できます。スクリプトは、Applications Managerへの設定後、ホスト監視へ関連付けできます。これによって、Applications Managerはスクリプトの属性を、ホスト監視の他の属性と同様に扱うようになります。この設定を行えば、スクリプトのステータスの変化を、ホストのステータスに反映させることが可能です。
システムにホストしてあるWebサイトを監視する際も同様です。Webサイトのステータス変更があれば、背後にサーバー ステータス変更が潜んでいる可能性があります。これに対処するには、URL監視を設定し、URLをホストに関連付けてください。Webサイトがダウンすると、ホストの監視ステータスに反映されるようになります。
- スクリプトの関連付け/削除:ホスト詳細で「スクリプトの関連付け/削除」のリンクをクリックしてください。ホストへの関連付けの有無にかかわらず、スクリプトがリストアップされます。関連付けや削除を行うスクリプトを選択してください。
- URLの関連付け/削除:ホスト詳細で「URLの関連付け/削除」のリンクをクリックしてください。ホストへの関連付けの有無にかかわらず、URLがリストアップされます。関連付けや削除を行うURLを選択してください。
監視のモード:SSH/TelnetとSNMPの比較
TelnetかSSHでの監視を推奨します。次の属性はSNMPでは取得できません。
- ディスクI/O統計
- プロセスのCPU利用率
- スワップ メモリ利用率
パラメーター詳細を先に確認するには、こちらをクリックして該当セクションに移動してください。
システム リソースを確認する際、管理者は一般的に、SNMP walkより、コマンド実行とSSH/Telnetモードの出力を比較するほうを好む傾向があります。SNMP walkと違いターミナル接続では、後ほど同じ接続を利用してスクリプト監視を実行したり、「プログラムの実行」アクションを起こしたりも可能です。
サーバー監視で使うコマンド
Applications Managerで、Windows、Linux、UNIXの監視に使うコマンドを、示します。
Windows
パラメーター | コマンド |
---|---|
ディスク利用率 | disk.vbs |
Win物理ディスク統計 | diskio.vbs |
ネットワーク インターフェース | NetworkInterface.vbs |
ネットワーク アダプター | NetworkAdapter.vbs |
メモリ利用率 | memory.vbs |
CPU利用率 | cpu.vbs |
CPUコア利用率 | cpucore.vbs |
サービス | services.vbs |
プロセス | PhyMemCpuImportProduct.vbs |
サーバー アップタイム | uptime.vbs |
Linux
パラメーター | コマンド |
---|---|
メモリ利用率 | free -b |
システム リブート | date +%s;/bin/cat /proc/uptime | cut -d "." -f1 |
スレッド数 | ps -eo nlwp | awk '{ threadcount += $1 } END { print threadcount }' |
ディスク利用率 | /bin/df -Pm |awk '{print $(NF-3) " " $(NF-2) " " $(NF-1) " " $NF}' |
ディスクI/O統計 | LANG=C iostat -d;echo '-----DISK_EXTENDED_STATS-----';iostat -d -x 1 3 |
システム負荷 | uptime |
CPU利用率 | /usr/bin/vmstat 1 3 |
CPUコア利用率 | mpstat -P ALL 1 3 |
サーバー アップタイム | uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2- |
UNIX
パラメーター | コマンド |
---|---|
メモリ利用率 | export UNIX95;top -d 1 -n 2 |
ディスク利用率 | /bin/df -m |
システム負荷 | uptime |
CPU利用率 | /usr/bin/vmstat 1 3 |
CPUコア利用率 | /usr/bin/vmstat -n 0 -P 1 3 |
サーバー アップタイム | uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2- |
cscript command hostname domain\username password
2:CPU利用率をWindows Server 2008とWindows 2000 Serverで測定するには、「cpu_2008.vbs」と「cpu_2000.vbs」をご利用ください。