適応しきい値
監視する装置や監視項目の数が多い環境では、全ての監視項目に手動でしきい値を設定するのが困難な場合があります。
適応しきい値機能では、機械学習モデルを使用して、過去の監視データから適切なしきい値を自動で動的に設定することが可能です。
適応しきい値機能を有効にできる監視項目は、以下の3種類です。
- CPU使用率
- メモリー使用率
- 応答時間
目次
適応しきい値の有効化
適応しきい値機能を有効にするには、[設定]→[監視]→[監視設定]→[適応しきい値(Beta)]に遷移し、[適応しきい値を有効にする]にチェックを付けて保存します。
適応しきい値のしくみ
適応しきい値機能では、パフォーマンス監視の過去の監視値を元に、機械学習を利用して1時間ごとの監視値の予測値を算出します。
他方、この予測値からどれだけ離れた場合にアラートを発報するかの差分値を、差分値(Deviation)としてユーザーが設定します。
予測値+差分値 の値をしきい値とし、その値を監視値が超えた場合に、対応する重要度のアラートを発報します。
適応しきい値の例
CPU使用率の適応しきい値を設定した場合を考えます。
各重要度のアラートに対する差分値を、以下のように設定します。
注意 | 警告 | 重大 |
---|---|---|
5 | 8 | 15 |
時刻0:00-1:00の間でのCPU使用率の予測値が34であったとします。
このとき、0:00-1:00の間の"注意"のしきい値は 34 + 5 = 39になり、この期間中にCPU使用率が39%以上となった場合に注意のアラートを発報します。
この場合、各期間中のアラートに対する重要度ごとのしきい値は、以下のようになります。
(上記の表の差分値を設定した場合)
時刻 | 予測値 | 注意のしきい値 | 警告のしきい値 | 重大のしきい値 |
---|---|---|---|---|
0:00 - 1:00 | 34 | 39 (34 + 5) | 42 (34 + 8) | 49 (34 + 15) |
1:00 - 2:00 | 36 | 41 | 44 | 51 |
2:00 - 3:00 | 44 | 49 | 52 | 59 |
3:00 - 4:00 | 58 | 63 | 66 | 73 |
4:00 - 5:00 | 54 | 59 | 62 | 69 |
差分値の設定
差分値の設定手順は以下の通りです。
- [設定]→[監視]→[監視設定]→[適応しきい値(Beta)]に移動します。
- [適応しきい値を有効にする]にチェックがついていない場合は、チェックを付けて有効化します。
- 適応しきい値を有効する項目のラジオボタンをクリックします。
- [高度な設定]をクリックします。
- ONにした監視項目の差分値(Deviation)を入力します。
- [関連付け]をクリックします。
- [保存]をクリックします。
上記設定後、後述の"適応しきい値の適用"の手順を実施し、実際の監視項目に適応しきい値を適用します。
適応しきい値の適用
適応しきい値を実際の監視項目に適用する方法は、設定範囲別に以下の3通りがあります。
- 装置単体への適用
- 装置テンプレートへの適用
- 複数の装置に対して一括で適用
装置単体への適用
個別の装置に対して適応しきい値を設定する方法は以下の通りです。
- [インベントリ]→[装置]より対象装置をクリックし装置の概要ページに移動します。
-
適応しきい値を適用する対象により、それぞれ以下の手順を実施します。
応答時間に対して適応しきい値機能を有効にする場合
-
"可用性タイムライン"の"応答時間"の右上のアイコンをクリックします。
-
[適応しきい値を有効にする]にチェックを入れ、[保存]をクリックします。
パフォーマンス監視に対して適応しきい値機能を有効にする場合
-
装置テンプレートへの適用
装置テンプレート単位で適応しきい値を適用する方法は以下の通りです。
- [設定]→[設定]→[装置テンプレート]に移動します。
- 適応しきい値を有効にする装置テンプレートのテンプレート名を選択し、装置テンプレートの編集画面に移動します。
- [関連付けられた装置]から、適応しきい値を有効にする監視項目の監視名を選択し、監視項目の編集画面に移動します。
テンプレート上に適応しきい値を有効にしたい監視項目が存在しない場合、[追加]から監視項目の追加が可能です。
-
[適応しきい値を有効にする]にチェックを入れ、[OK]をクリックします。
適応しきい値を有効にできるパフォーマンス監視は、CPU使用率とメモリー使用率のみです。
適応しきい値機能を有効にした後も[適応しきい値を有効にする]が表示されていない場合、その監視項目は適応しきい値機能の対象外です。 - [保存]をクリック、または変更内容を装置に関連付ける場合こちらの手順を実行します。
複数の装置に対して一括で適用
複数の装置に対して一括で適応しきい値を適用する方法は以下の通りです。
- [設定]→[監視]→[パフォーマンス]に移動します。
- 適応しきい値を適用したい監視項目の監視名をクリックし、編集画面に移動します。
-
[適応しきい値を有効にする]にチェックを入れ、[OK]をクリックします。
適応しきい値を有効にできるパフォーマンス監視は、CPU使用率とメモリー使用率のみです。
適応しきい値機能を有効にした後も[適応しきい値を有効にする]が表示されていない場合、その監視項目は適応しきい値機能の対象外です。 - 追加したパフォーマンス監視を装置に紐づける場合は、こちらの手順を実行
適応しきい値の無効化
適応しきい値を無効にした場合、その監視項目のしきい値は、適応しきい値有効化前のものに復元されます。
適応しきい値の無効化は、以下の3通りの方法で設定できます。
全ての適応しきい値を一括で無効化する場合
[設定]→[監視]→[監視設定]→[適応しきい値(Beta)]に遷移し、[適応しきい値を有効にする]のチェックを外して保存します。
監視項目ごと適応しきい値を一括で無効化する場合
[設定]→[監視]→[監視設定]→[適応しきい値(Beta)]に遷移し、CPU使用率、メモリー使用率および応答時間のうち、無効化する監視項目のチェックを外して保存します。
一部の適応しきい値のみを無効化する場合
装置単体への適用、装置テンプレートへの適用および複数の装置に対して一括で適用に記載のものと同様の手順を、[適応しきい値を有効にする]のチェックを外した場合で実施します。
留意事項
- OpManagerが適応しきい値で使用する予測値を算出するためには、最低でも3日分のパフォーマンスデータを必要とします。
対象の監視項目が3日以上監視データを保持していない場合は、十分な監視データを得るまで予測値は生成されず、アラートの発報に遅れが生じる場合があります。 - 適応しきい値によるアラートが意図せず頻発する場合、差分値を大きくすることで適応しきい値も大きくなり、アラート発報の頻度を下げることが可能です。