サーバー監視

概要

ネットワーク レベルの管理では、ステータスと接続の全体像を鳥瞰的に維持する必要があります。ネットワークにあるマシンのステータスや、負荷レベル、利用効率を把握することは、過負荷やパフォーマンス低下に陥っているシステムを特定し、是正を可能とするうえで最重要です。他方で、サーバー レベルの管理では、地に足の着いた業務が必要で、多大な手動作業、人力、管理業務が必要となります。Applications Managerのサーバー監視機能では、このような目標の達成と、ホストの設定管理が容易になります。

対応OS

  1. Windows
  2. Linux
  3. Sun Solaris
  4. IBM AIX(ページ スペース詳細
  5. IBM AS/400(iSeries)
  6. HP-UX
  7. Tru64 UNIX
  8. FreeBSD
  9. Mac OS
  10. Novell UNIX SUSEではありません

新規サーバー監視を作成するには

サーバー監視を作成するには、次の手順に従ってください。

  1. 新規監視へ移動して、新規監視の追加をクリックします。サーバーのセクションで、必要なサーバー タイプを選択してください。
  2. ホストのIPアドレスか名前を入力してください。
  3. ネットワークのサブネット マスクを入力してください。
  4. 監視のモードを選択します(WMI/SNMP/SSH/Telnet)。
  5. 認証用のユーザー名パスワードを入力するか、認証情報リストからの選択を有効にして、認証情報マネージャーから選択してください。
  6. ポーリング間隔を入力してください(分)。
  7. Enterprise EditionのAdminサーバーから新規監視を追加するには、Managedサーバーを選択します。
  8. 監視固有の認証情報を指定します。OSタイプを選択してください。Windowsでは、Windows NT、Windows XP、Windows Vista、Windows 7、Windows 8、Windows 10、Windows 2000、Windows 2003、Windows 2008、Windows 2012、Windows 2016、Windows 2019を、そのほか、Linux、Solaris、IBM AIX、IBM AS/400、HP-UX、Tru64 UNIX、FreeBSD、Mac OS、Novell UNIX、Windowsクラスターを選択できます。OSによって、利用できる「監視のモード」情報も変化します。
  9. コンボボックスから、監視グループに関連付けるサーバーを選択します(任意項目)。監視は複数グループに関連付け可能です。
  10. 監視の追加をクリックすると、ネットワークから必要なサーバーを検出し、監視を始めます。
メモ

サーバー監視の追加中に入力内容を間違った時は、問題の診断が可能です。問題の診断をクリックすると、pingテスト、ホスト詳細、監視モードなどのサーバー関連情報を表示するとともに、ホストごとの孤立したエントリを表でリストアップします。この情報は、WMI監視モードには適用されません。

監視対象のパラメーター

  • 可用性タブでは、過去24時間か30日の可用性履歴がわかります。
  • パフォーマンス タブでは、過去24時間か30日のステータスとイベントがわかります。
  • リスト ビューでは、一括管理設定が可能です。

リストにある監視をそれぞれクリックすると、次の情報が表示されます。

パラメーター 説明
システム負荷 システムが1/5/15分で処理したジョブの数を示します。ピーク値のほか、現在の値とステータスもわかります。
ディスク利用率 システムが利用しているハード ディスク スペースを示し、ディスク パーティション パラメーターのピーク値や、現在の値とステータスの更新を行います(パラメーターには、WindowsではCやDなどのドライブ文字が、Linuxでは/homeなどのディレクトリが含まれます)。
メモリ利用率
  • スワップ メモリ利用率:システムが利用しているスワップ スペースや仮想メモリを示します。ピーク値や、現在の値とステータスも表示します。
  • 物理メモリ利用率:システムが利用している物理メモリを示します。ピーク値や、現在の値とステータスも表示します。
ディスクI/O統計 装置ごとの読み書き速度を表します(数/秒)。
CPU利用率 システムが利用しているCPU総量と、ピーク値、現在の値、現在のステータスを示します。

 

メモ:サーバーにあるドライブのうち特定ディスクを無視することができます。<AppManager Home/Conf>にある<AMServer.properties>ファイルで、<am.disks.ignore>に監視不要なドライブを指定してください。

# 下記ドライブ文字のストレージは、サーバー監視で対象外となります。
am.disks.ignore=C

複数ディスクはカンマ区切りで指定します。Windowsの場合はC,Dなどとしてください。Linuxの場合は、/home/user1,/home/user2などの指定ができます。ただし、前方一致で判断するため、/home/userとだけ指定すれば、user1と2を含め全員が排除対象です。

以下、監視するパラメーターと監視のモードを表で示します。アイコン対応は、対応を表します。

 
メモ:サーバー監視をTelnet/SSHモードで追加する場合、本日の可用性円グラフの下からサーバーでコマンドを実行するをクリックし、Telnetクライアントに直接アクセスすることも可能です。この機能はデフォルトでは無効となっています。

有効にするには、このTelnetクライアントを使う権限を、管理者やオペレーターに付与してください。管理タブ > ユーザー管理 > 権限とクリックして、作業ください。

 

OS

Telnet SSH SNMP WMI
Windows 対応 対応 (Applications ManagerをWindowsにインストールした場合のみ)
Linux 対応 対応 対応
Solaris 対応 対応 対応
HP-UX/Tru64 UNIX 対応 対応
FreeBSD 対応 対応 対応
Mac OS 対応 対応 対応
IBM AIX 対応 対応
Novell UNIX SUSEではありません 対応
属性
CPU利用率(Windows NT以外、すべて) 対応 対応 対応 対応
ディスク利用率(全タイプ) 対応 対応 対応 対応
物理メモリ利用率 (IBM AIXはrootユーザーのみ、WindowsはWMIモードのみ、その他は全タイプ) 対応 対応 対応 対応
スワップ メモリ利用率 (IBM AIXはrootユーザーのみ、FreeBSD、Linux、Solaris、Windows、Novell UNIX) 対応 対応 対応 対応
ネットワーク インターフェース(全タイプ) 利用可能 利用可能 (ステータス属性データは利用不法)
プロセス監視(全タイプ) 対応 対応 対応 対応
プロセス監視:メモリ利用率(全タイプ) 対応 対応 対応 対応
プロセス監視:CPU利用率 (IBM AIX、FreeBSD、Linux、Mac OS、Solaris、HP-UX、Tru64) 対応 対応 対応
サービス監視(Windowsのみ) 対応
イベント ログ(Windowsのみ) 対応
システム負荷(IBM AIX、FreeBSD、Linux、Mac OS、HP-UX、Solaris、Novell UNIX) 対応 対応 対応
ディスクI/O統計 (only for IBM AIX、Linux、Solaris、Novell UNIX) 対応 対応
ディスクI/O統計 (IBM AIX、Linux、Solaris、Novell UNIX) 対応 Windows Server監視参照
サーバー アップタイム (IBM AIX、FreeBSD、Linux、Mac OS、HP-UX、Solaris、Novell UNIX、Windows) 対応 対応 対応 対応
メモ:設定の詳しい情報は、ホスト リソースのディスカバリ詳細を、データ収集の解説ページで確認いただけます。

AIXでは、ディスクI/O統計の平均キュー長はサポートしていません。

サーバー監視のモードには、SNMPよりTelnet/SSHを推奨します。

AIXサーバーでのページング スペース

AIXサーバーのページング スペース情報を取得するには、コマンド「lsps -a」を実行します。

lspa -a」が表示するのは、ページング スペース論理ボリュームの現在の場所ではなく、過去の場所です。

通常、ページング スペースは、システムにあるプロセスが割り当てメモリ全体を使い果たし、メモリ スペースが枯渇した時に利用されます。実行中のプロセスが参照していないコードやデータは、ページング スペース エリアへと移され、プロセスが再びコードやデータを参照する際に、主メモリへ戻すこととなります。

AIXサーバーの監視中に、ページング スペースで「No data available」(データがありません)というエラーが出た場合、次の手順でトラブルシュートしてください。

はじめに、TelnetSSHで接続します。

つづいて、コマンドlsps -aがシステムに存在するか調べ、実行してください。

メモ:AIXでは、ディスクI/O統計の平均キュー長はサポートしていません。

ページング スペース特性を表示する

lsps」コマンドは、ページング スペース名、物理ボリューム名、ボリューム グループ名、サイズ、ページング スペース利用率(%)、スペースはアクティブか非アクティブか、ページング スペースは自動にセットされているかなど、ページング スペース特性を表示します。各パラメーターは表示特性を示します。

以下、lspsコマンドでフラグを利用し、ページング スペース情報を表示する例を示します。「-c」フラグを立てると、コロン形式の情報と物理パーティションにあるページング スペースのサイズが表示されます。

# lsps -aのCLI出力イメージは次のとおりです。

Page Space Physical Volume Volume Group Size %Used Active Auto Type
paging00 hdisk1 rootvg 80MB 1 yes yes lv
hd6 hdisk1 rootvg 256MB 1 yes yes lv

ページング スペースの追加とアクティベートには

OSでページング スペースを利用できるようにするには、まずページング スペースを追加し、つづいてそれを利用可能とする必要があります。システムがページングに利用できる総スペースは、アクティブなページング スペース論理ボリュームすべての合計サイズです。

メモ:ページング スペースを、ポータブル ディスクにあるボリューム グループに追加しないでください。ページング スペースがアクティブな際にディスクを取り外すとシステム クラッシュの原因となります。

これらコマンドの詳細は、こちらを参照ください。

上記のパラメーターとは別に、次の項目も監視できます。

サーバーのプロセスを監視するには

  1. プロセス詳細からサーバー監視ページで、新規プロセスの追加をクリックします。
  2. 実行中のすべてのプロセスと、そのCPU・メモリの利用率統計が表示されます(メモリ統計は、WindowsをSNMPモードで監視する時のみサポートします)。
  3. 監視するプロセスを選択します。

設定したプロセスは、Windows監視ページのプロセス詳細に表示されます。プロセスをクリックすると、可用性のグラフが表示されます。特定プロセスにアラート設定も可能です。

特定プロセスを選んで表示名、プロセス名、コマンド、引数を編集するには、プロセスの編集アイコンをクリックしてください。

Windowsサービスを監視するには

  1. Windows監視ページで、サービス詳細から新規サービスの追加をクリックします。
  2. 実行中のサービスが全て、サービス名やステータスとあわせ表示されます。
  3. 監視するサービスを選択します。

設定したサービスは、Windows監視ページのサービス詳細に表示されます。サービスをクリックすると、可用性のグラフが表示されます。特定サービスの可用性にアラート設定も可能です。

サービスの可用性監視のほか、サービスの起動停止再起動もできます。サービスのダウンに備え、「サービスの再起動」やその他のアクションを設定することも可能です。

メモ:Windowsサービス監視は、WMIモードで監視をしている場合のみ利用できます。

ネットワーク インターフェースを監視する

サーバー監視ページのネットワーク インターフェースでは、ネットワーク インターフェースすべてが表示されます。監視できる属性は次のとおりです。

  • インターフェース トラフィック:受信トラフィック(ビット)、送信トラフィック (ビット)。これらの属性には、アラートしきい値の設定もできます。
  • インターフェース利用率:受信利用率(%)と送信利用率(%)です。これらの属性には、アラートしきい値の設定もできます。
  • 受信パケット:パケット受信速度です(数/秒)。
  • 送信パケット:パケット送信速度です(数/秒)。
  • エラー パケット:受信後のパケット エラーのレートです(数/秒)。
  • 廃棄パケット:受信後のパケット廃棄のレートです(数/秒)。
  • ステータス:インターフェースのステータスを属性を基準に示します。
  • ステータス:インターフェースがアップかダウンか示します。SNMPでの監視の場合のみ表示されます。
メモ:ネットワーク インターフェース監視は、監視のSNMPモードとWMIモードでのみ実行できます。

スクリプトとURLのホスト リソースへの関連付け

スクリプトやURLのホスト リソースへの関連付けで、これらの属性データもホスト詳細に表示されるようになります。ホスト リソースのステータスは、スクリプトやURLのステータスに依存して決まることもあります。

たとえば、ASP.NETアプリケーションの要求実行時間、現在の要求、切断済みの要求パフォーマンス カウンターは、WMIで取得できるようになっています。Applications Manager標準機能ではこの情報は取得できませんが、情報を取得する自作スクリプトがあれば、そのままApplications Managerに設定できます。スクリプトは、Applications Managerへの設定後、ホスト監視へ関連付けできます。これによって、Applications Managerはスクリプトの属性を、ホスト監視の他の属性と同様に扱うようになります。この設定を行えば、スクリプトのステータスの変化を、ホストのステータスに反映させることが可能です。

システムにホストしてあるWebサイトを監視する際も同様です。Webサイトのステータス変更があれば、背後にサーバー ステータス変更が潜んでいる可能性があります。これに対処するには、URL監視を設定し、URLをホストに関連付けてください。Webサイトがダウンすると、ホストの監視ステータスに反映されるようになります。

  • スクリプトの関連付け/削除:ホスト詳細で「スクリプトの関連付け/削除」のリンクをクリックしてください。ホストへの関連付けの有無にかかわらず、スクリプトがリストアップされます。関連付けや削除を行うスクリプトを選択してください。
  • URLの関連付け/削除:ホスト詳細で「URLの関連付け/削除」のリンクをクリックしてください。ホストへの関連付けの有無にかかわらず、URLがリストアップされます。関連付けや削除を行うURLを選択してください。

監視のモード:SSH/TelnetとSNMPの比較

TelnetかSSHでの監視を推奨します。次の属性はSNMPでは取得できません。

  • ディスクI/O統計
  • プロセスのCPU利用率
  • スワップ メモリ利用率

パラメーター詳細を先に確認するには、こちらをクリックして該当セクションに移動してください。

システム リソースを確認する際、管理者は一般的に、SNMP walkより、コマンド実行とSSH/Telnetモードの出力を比較するほうを好む傾向があります。SNMP walkと違いターミナル接続では、後ほど同じ接続を利用してスクリプト監視を実行したり、「プログラムの実行」アクションを起こしたりも可能です。

サーバー監視で使うコマンド

Applications Managerで、Windows、Linux、UNIXの監視に使うコマンドを、示します。

Windows

パラメーター コマンド
ディスク利用率 disk.vbs
Win物理ディスク統計 diskio.vbs
ネットワーク インターフェース NetworkInterface.vbs
ネットワーク アダプター NetworkAdapter.vbs
メモリ利用率 memory.vbs
CPU利用率 cpu.vbs
CPUコア利用率 cpucore.vbs
サービス services.vbs
プロセス PhyMemCpuImportProduct.vbs
サーバー アップタイム uptime.vbs

Linux

パラメーター コマンド
メモリ利用率 free -b
システム リブート date +%s;/bin/cat /proc/uptime | cut -d &#34;.&#34; -f1
スレッド数 ps -eo nlwp | awk '{ threadcount += $1 } END { print threadcount }'
ディスク利用率 /bin/df -Pm |awk '{print $(NF-3) &quot; &quot; $(NF-2) &quot; &quot; $(NF-1) &quot; &quot; $NF}'
ディスクI/O統計 LANG=C iostat -d;echo '-----DISK_EXTENDED_STATS-----';iostat -d -x 1 3
システム負荷 uptime
CPU利用率 /usr/bin/vmstat 1 3
CPUコア利用率 mpstat -P ALL 1 3
サーバー アップタイム uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2-

UNIX

パラメーター コマンド
メモリ利用率 export UNIX95;top -d 1 -n 2
ディスク利用率 /bin/df -m
システム負荷 uptime
CPU利用率 /usr/bin/vmstat 1 3
CPUコア利用率 /usr/bin/vmstat -n 0 -P 1 3
サーバー アップタイム uptime|cut -d ',' -f1,2|tr -s ' ' '^'|cut -d '^' -f 2-

 

メモ
1:Windowsの場合、コマンド プロンプトを管理者として開き、<AppManager_Home>\working\conf\applications\scriptsディレクトリから、次の形式で実行してください。
cscript command hostname domain\username password
commandは上記記載のコマンドそれぞれに、hostnameはサーバーの実際のホスト名に、usernameとpasswordは資格情報への置き換えが必要です。

2:CPU利用率をWindows Server 2008とWindows 2000 Serverで測定するには、「cpu_2008.vbs」と「cpu_2000.vbs」をご利用ください。