Docs » Splunk Observability Cloudにおけるサービスレベル目標(SLO)管理の概要 » サービスレベル目標(SLO)を用いて、サービスの健全性メトリクスを測定および追跡します。

サービスレベル目標(SLO)を用いて、サービスの健全性メトリクスを測定および追跡します。 🔗

Splunk Observability Cloud でシステムの健全性を示すために使用するサービスごとに、SLO とその測定方法を定義できます。

SLO を作成する 🔗

SLO を作成するには、以下の手順に従ってください。

  1. Splunk Observability Cloudのランディングページから、ディテクターとSLO に移動します。

  2. SLO タブを選択します。

  3. Create SLO を選択します。

  4. SLOのサービスレベル指標(SLI)を設定します。システムの健全性の指標として、サービスまたは任意のメトリクスを使用できます。

    To use a service as the system health indicator for your SLI configuration, follow these steps:

    フィールド名

    アクション

    Metric type

    ドロップダウンメニューから Service & endpoint を選択します

    Environment

    ドロップダウンメニューを開き、この SLO を適用する環境のボックスにチェックを入れます

    Service:endpoint

    • SLO を作成するサービスを検索します。

    • (オプション)選択したサービスのエンドポイントを追加します。

    Indicator type

    Select either success rate or latency to use as the measurement for your SLO target:

    • Request success: Measure the proportion of requests that result in a successful response over the duration of the compliance window

    • リクエストのレイテンシ:コンプライアンスウィンドウ期間中に指定したレイテンシ内に読み込まれたリクエストの割合を測定します

    Filters

    このSLOの適用先とする追加のディメンション名と値を入力します。感嘆符(!)で表される NOT フィルターを使用して、このSLO設定から任意のディメンション値を除外することもできます。

    To use a metric of your choice as the system health indicator for your SLI configuration, follow these steps:

    1. For the Metric type field, select Custom metric from the dropdown menu. The SignalFlow editor appears.

    2. In the SignalFlow editor, you can see the following code sample:

      G = data('good.metric', filter=filter('sf_error', 'false'))
      T = data('total.metric')
      
      • 1行目は、good.metric メトリック時系列(MTS)のデータストリームとして G を定義しています。SignalFlowの filter() 関数は、sf_error ディメンションに false の値を持つMTSの集合をクエリします。このフィルターによって、成功したリクエスト数とリクエスト総数を区別し、 G を成功イベントの変数にしています。

      • 2行目は、Ttotal.metric MTSのデータストリームとして定義しています。T は、イベント総数の変数です。

      このコードサンプルをご自身のSignalFlowプログラムに置き換えてください。任意のメトリクスとサポートされているSignalFlow関数を使用して、成功イベントの変数とイベント総数の変数を定義できます。詳細については、Splunk Observability Cloud開発者ガイドの SignalFlowを使用したデータ分析 を参照してください。

    3. Good events (numerator) および Total events (denominator) のドロップダウンメニューに、適切な変数名を選択します。

    注釈

    カスタムメトリクスSLOは、特定のコンプライアンス期間中に成功したリクエストのパーセンテージを計算することにより機能します。この計算は、ゲージメトリクスよりもカウンターメトリクスやヒストグラムメトリクスの場合にうまく機能します。ゲージメトリクスはカスタムメトリクスSLOには適さないため、設定でゲージメトリクスを選択すると、データが混乱する可能性があります。

  5. SLOとその測定方法を定義します。

    フィールド名

    アクション

    Target (%)

    この SLO に設定する目標を入力します。

    Latency (ms)

    「リクエストのレイテンシ」のSLIタイプでのみ使用可能、かつ必須です。サービスリクエストの目標読み込み時間を入力します。

    Compliance window

    ドロップダウンメニューから、この SLO のコンプライアンスウィンドウを選択します。

  6. SLOのアラートを設定します。以下のアラートの通知を受け取るために登録することができます。

    アラート

    説明

    Breach event

    サービスレベルインジケータ(SLI)が、指定されたコンプライアンスウィンドウを越えて目標を満たさない場合にアラートを表示します。
    注: 違反イベントアラートはデフォルトで選択されており、常にバックグラウンドで実行されます。

    Error budget

    残りのエラー予算が、コンプライアンスウィンドウの推定エラー予算の10%未満である場合にアラートを発します。

    Burn rate

    SLO エラー予算の消費率が、指定されたコンプライアンスウィンドウの健全なしきい値を超えた場合にアラートを発します。詳細については、燃焼率アラート を参照してください。

  7. Splunk Observability Cloud は SLO の名前を自動的に生成します。SLO 名が一意である限り、この自動生成された名前は変更できます。

  8. Create を選択して SLO を作成します。

このページは 2024年10月01日 に最終更新されました。