アノマリプロファイル
概要
アノマリプロファイルは、パフォーマンスが徐々に低下していくことを検知します。
上限値に加えて下限値の監視も行うことで、 可変しきい値プロファイルよりも詳細なしきい値プロファイル設定が可能です。
理想的なパフォーマンスを示した週のデータを基準に設定し、随時そのパフォーマンスと比較することができます。
アノマリプロファイルの仕組み
アノマリプロファイルの仕組みは以下の図のようになっています。
アノマリダッシュボードからパフォーマンスメトリックすべてを確認し、容易にトラブルシュートを実行できます。
アノマリプロファイルには、ベースライン値とカスタム表現という2つの定義方法があります。
ベースライン値:特定の週をベースラインとして設定し、その値と比較する方法
カスタム表現:Applications Managerのシステム変数を使用してベースを設定し、その値と比較する方法
アノマリプロファイルの作成方法
ベースライン値
- [しきい値プロファイル]タブ→[新規アノマリプロファイル]→[続ける]をクリック
または[設定]→アラート/アクション配下の[しきい値/アノマリ]を選択し、[アノマリプロファイル]タブ→[新規追加]をクリックしてください。
- アノマリプロファイルの詳細を設定(ベースライン値)
- アノマリプロファイル名
アノマリプロファイルの表示名を入力します。 - アノマリ検出基準
ベースライン値を選択します。 - ベースライン日付範囲を設定
- 固定ベースライン値の基準
過去に監視していた期間で、指定したい1週間を選択し、その1週間のデータを基準とします。
理想的なパフォーマンスで、アラートの少なかった週を選択することをおすすめします。
ベースラインとする週を決めると、曜日ごとの値を比較します。
たとえば、8月第1週をベースラインにした場合、毎週月曜日のデータは8月第1週の月曜日のデータと比較します。 - 移動ベースライン値の基準 "先週" レポートデータ
先週1週間のデータを比較対象とします。前週の結果に応じて、ベースラインとする値が変化します。
- 固定ベースライン値の基準
- アノマリとして扱うタイミング
ベースラインからどのくらい値が遷移したら異常と判断するか、上限値、下限値を指定します。
値は比率(%)または数値を直接指定することができます。
たとえば、ベースライン値が70の場合、上限・下限に10%を設定すると、ベースラインの範囲は64から77です。
上限・下限に10を設定すると、範囲は60から80になります。 - 比較方法(※)
- ベースラインと最新1時間を直接比較(推奨)
毎時値をベースラインと直接比較する方法です。 - 前の1時間との対応差分値で比較
対応する毎時値の差分と比較する方法です。
- ベースラインと最新1時間を直接比較(推奨)
- アノマリプロファイル名
- [アノマリプロファイルの作成]をクリック
(※)比較方法について
- ベースラインと最新1時間を直接比較(推奨)
例:現在の時刻が月曜日の午前10時で、ベースライン日付範囲が第2週とします。 この場合、第2週の月曜午前10時の値を採用して、「アノマリとして扱うタイミング」で指定した設定と比較します。 - 前の1時間との対応差分値で比較
例:現在の時刻が月曜日午前10時の場合、直前の午前9時と午前10時の値の差分値(D1)を計算します。 ベースライン値を先週1週間に設定している場合、先週の月曜日の午前9時と午前10時の値の差分値(D2)も計算し、D1とD2の差分を元に比較します。 →D1とD2の差分をパーセントや値で比較し、設定した上限と下限を越えるとアラートが発生します。
カスタム表現
- [しきい値プロファイル]タブ→[新規アノマリプロファイル]→[続ける]をクリック
または[設定]→アラート/アクション配下の[しきい値/アノマリ]を選択し、[アノマリプロファイル]タブ→[新規追加]をクリックしてください。
- アノマリプロファイルの詳細を設定(カスタム表現)
- アノマリプロファイル名
アノマリプロファイルの表示名を入力します。 - アノマリ検出基準
カスタム表現を選択します。 - アノマリとして扱うタイミング
利用可能なシステム変数(※)より、異常と判断する値を設定します。
例:- 重大アラートに「$LastHourValue > 10*$7D_MVA+$30D_MVA」を入力し、重大アラートをドロップダウンから選択
【解説】
最新1時間の平均値が7日の移動平均と30日の移動平均を足したものの10倍より大きかったら、重大アラートを上げる。 - 警告アラートに「$LastHourValue <= 25*$6H_MVA+$10D_MVA」を入力し、警告アラートをドロップダウンから選択
【解説】
最新1時間の平均値が6時間の移動平均と10日の移動平均を足したものの25倍以上なら、警告アラートを上げる。
- 重大アラートに「$LastHourValue > 10*$7D_MVA+$30D_MVA」を入力し、重大アラートをドロップダウンから選択
- [アノマリプロファイルの作成]をクリック
システム変数(※)
カスタム表現を使用する際のシステム変数について、以下の表をご参照ください。
表現 | 意味 |
---|---|
$10D_MVA | 10日の移動平均 |
$LastHourValue | 最新1時間の平均 |
$6H_MVA | 6時間の移動平均 |
$30D_MVA | 30日の移動平均 |
$10H_MVA | 10時間の移動平均 |
$7D_MVA | 7日の移動平均 |
アノマリプロファイルの関連付け方法
- それぞれの監視の詳細ページへ移動。アラートを設定する属性を選択したのち、アラートの設定をクリック
- しきい値とアノマリの詳細が表示されたら、アノマリ詳細タブをクリック
- ドロップダウンから属性を適宜選択し、対応するアノマリプロファイルに関連付け
- アラート設定を保存
依存属性のステータスにメールアクションが関連付けられていると、監視ステータスが重大の際メール通知が発生します。
アノマリダッシュボード概要
アノマリダッシュボードを使用することで、パフォーマンスメトリックすべてを確認できます。
複数のパフォーマンスメトリックを直感的にご覧いただけます。
アノマリダッシュボードの表示方法
- 属性/監視グループ/監視のステータスが重大になる、または可用性がダウンした場合、ダッシュボード画面の[最新10アラート]ウィジェットのアイコンをクリックし、[トラブルシュートのため、アノマリダッシュボードを利用]をクリック
- [アラート]タブで、ステータスが重大のアラートの[アラートメッセージ]をクリックし、履歴欄の右端にある[アノマリダッシュボード]アイコンをクリック
アノマリダッシュボードの各項目について
- 画面上部にある、[重大のみ表示]と[すべて表示]を選択して、表示数を設定
※ステータスは、リソースの属性に関連付いたアノマリプロファイルを基準に決まります。 - 基本メトリック
各メトリックを現在時刻を基準に表示。ドロップダウンから、時刻や属性の変更も可能です。
※選択した時刻は、その他の値の計算すべてで利用されます。 - 監視タイプ項目
- 最新ポーリング:最新1時間の値を表示
- 12時間:12時間平均を線グラフで表示
- 7DH(7日間の毎時データ):棒グラフで表示。各カラムのクリックで、詳細レポートが表示されます。
- アノマリプロファイルを監視の属性に関連付けた後、異常が検知されると、監視ステータスが重大になり、[12時間]のグラフの背景が赤で表示されます。
カラムをクリックすると、アノマリ値に達した時刻など、詳細レポートを確認できます。
機械学習によるアノマリ検知
[アラート設定]ページから、機械学習しきい値を関連付けることが可能です。これは、RPCAアルゴリズムを使用して異常を判断するものです。
データの突然/異常なスパイクを特定し、それに応じてアラートを発報します。
このしきい値を有効にすると、監視対象のデータを数時間収集した後、現在のデータと比較して異常がないかどうかを分析します。
監視データに異常な値が検出された場合、重大度「クリティカル」のアラートが生成され、RCAメッセージが表示されます。
監視データに異常がない場合、重大度「クリア」でアラートがクリアされます。
※RCAメッセージとは、予想値と実際の値を比較して、アラートの原因と考えられるデータの詳細を表示するものです。
機械学習ベースのアノマリ検知は、数値属性にのみ適用されます。次のタイプの属性では利用できません。
- 正常性
- 可用性
- 文字列属性
- 構成数値属性
ハードウェア構成など、データ収集の際に頻繁に変更されない数値属性。
例:Windows監視のハードウェア情報(総物理メモリ・総スワップメモリ) - 構成文字列属性
ハードウェア構成など、データ収集の際に頻繁に変更されない文字列属性。
例:Windows監視のハードウェア情報(OSバージョン;OSリリース)
関連情報: