サービスレベル目標(SLO)を用いて、サービスの健全性メトリクスを測定および追跡します。 🔗
Splunk Observability Cloud でシステムの健全性を示すために使用するサービスごとに、SLO とその測定方法を定義できます。
SLO を作成する 🔗
SLO を作成するには、以下の手順に従ってください。
Splunk Observability Cloudのランディングページから、ディテクターとSLO に移動します。
SLO タブを選択します。
Create SLO を選択します。
Configure the service level indicator (SLI) for your SLO. You can use a service or any metric of your choice as the system health indicator.
To use a service as the system health indicator for your SLI configuration, follow these steps:
フィールド名
アクション
Metric type
ドロップダウンメニューから Service & endpoint を選択します
Environment
ドロップダウンメニューを開き、この SLO を適用する環境のボックスにチェックを入れます
Service:endpoint
SLO を作成するサービスを検索します。
(オプション)選択したサービスのエンドポイントを追加します。
Indicator type
Select either success rate or latency to use as the measurement for your SLO target:
Request success: Measure the proportion of requests that result in a successful response over the duration of the compliance window
Request latency: Measure the proportion of requests that load within the specified latency over the duration of the compliance window
Filters
Enter any additional dimension names and values you want to apply this SLO to. Alternatively, use the
NOT
filter, represented by an exclamation point ( ! ), to exclude any dimension values from this SLO configuration.To use a metric of your choice as the system health indicator for your SLI configuration, follow these steps:
For the Metric type field, select Custom metric from the dropdown menu. The SignalFlow editor appears.
In the SignalFlow editor, you can see the following code sample:
G = data('good.metric', filter=filter('sf_error', 'false')) T = data('total.metric')
Line 1 defines
G
as a data stream ofgood.metric
metric time series (MTS). The SignalFlowfilter()
function queries for a collection of MTS with valuefalse
for thesf_error
dimension. The filter distinguishes successful requests from total requests, makingG
the good events variable.Line 2 defines
T
as a data streamtotal.metric
MTS.T
is the total events variable.
Replace the code sample with your own SignalFlow program. You can define good events and total events variables using any metric and supported SignalFlow function. For more information, see Analyze data using SignalFlow in the Splunk Observability Cloud Developer Guide.
Select appropriate variable names for the Good events (numerator) and Total events (denominator) dropdown menus.
注釈
Custom metric SLO works by calculating the percentage of successful requests over a given compliance period. This calculation works better for counter and histogram metrics than for gauge metrics. Gauge metrics are not suitable for custom metric SLO, so you might get confusing data when selecting gauge metrics in your configuration.
SLOとその測定方法を定義します。
フィールド名
アクション
Target (%)
この SLO に設定する目標を入力します。
Latency (ms)
Only available and required for request latency SLI type. Enter the target loading time for your service requests.
Compliance window
ドロップダウンメニューから、この SLO のコンプライアンスウィンドウを選択します。
SLOのアラートを設定します。以下のアラートの通知を受け取るために登録することができます。
アラート
説明
Breach event
サービスレベルインジケータ(SLI)が、指定されたコンプライアンスウィンドウを越えて目標を満たさない場合にアラートを表示します。注: 違反イベントアラートはデフォルトで選択されており、常にバックグラウンドで実行されます。Error budget
残りのエラー予算が、コンプライアンスウィンドウの推定エラー予算の10%未満である場合にアラートを発します。
Burn rate
SLO エラー予算の消費率が、指定されたコンプライアンスウィンドウの健全なしきい値を超えた場合にアラートを発します。詳細については、燃焼率アラート を参照してください。
Splunk Observability Cloud は SLO の名前を自動的に生成します。SLO 名が一意である限り、この自動生成された名前は変更できます。
Create を選択して SLO を作成します。