シナリオ:Kaiが、ある顧客グループ向けのサービスのレイテンシのディテクターを監視する 🔗
架空の企業、Buttercup Gamesのサイト信頼性エンジニアであるKaiは、サービスの問題を最も高い頻度で受けている特定の顧客グループ向けのカートサービスと /getcart
エンドポイントの重要な精算ワークフローに影響を与えているレイテンシの問題を監視したいと考えています。
Kaiは、カートサービスのレイテンシを監視するために以下の手順を踏みます:
KaiはMonitoring MetricSet(MMS)を生成し、スパンタグでフィルタリングする 🔗
顧客別にMonitoring MetricSets(MMS)を生成するために、Kaiは各顧客を識別するためにスパンタグにインデックスを付けます: version_id
。次に、 version_id
をディメンションとして使用し、MMSを生成します。MMSのスコープを cartservice
に設定し、調査したい特定の顧客リストを表す version_id
のタグ値でフィルタリングします。
次の画像は、cartservice
エンドポイント /getcart
のMMS設定例と、version_id
のタグ値によるフィルタリングを示しています:
Kaiがサービスレイテンシのディテクターを作成してメトリクスを追跡する 🔗
Kaiは、作成したカスタムディメンションMMSを使用して、カートサービスにおけるこの重要な精算ワークフローのパフォーマンスを監視します。これを行うために、Kaiは同じカスタムインデック付きスタグ( version_id
)を使用してディテクターを作成し、この精算ワークフローに関連するエラー率を追跡します。
Kaiは、ディテクター作成のガイド付きセットアップに従って、cartservice:GetCart のサービスのエラー率に基づき、version_id
のカスタムディメンションでフィルタリングしてディテクターを作成します。
Kaiは、メトリクスファインダーを使用して、システムのメトリクスとメタデータに関する追加情報を検索します。次の画像に示すように、関連するメトリクスを表示するフィルターとして sf_dimensionalized:true を適用します。
Kaiがカスタムディメンションのチャート、ダッシュボード、アラートを設定する 🔗
またKaiは、作成したカスタムディメンションを使用したチャートやダッシュボードも作成します。
まとめ 🔗
version_id
をカスタムディメンションとして使用したMMSを生成し、問題の影響を受けている顧客にフィルタリングすることで、Kaiは顧客ごとにサービスとエンドポイントのレイテンシを監視するディテクターを設定しました。また、特定の顧客向けのサービスとエンドポイントのレイテンシを経時的に表示するチャートとダッシュボードを作成しました。
さらに詳しく 🔗
spanタグのインデックス化についての詳細は、Index span tags to create Troubleshooting MetricSets を参照してください。
カスタムMMSの生成については、Create a Monitoring MetricSet with a custom dimension を参照してください。
その他のメトリクスとメタデータの詳細については、メトリクス・ファインダーとメタデータ・カタログを検索する を参照してください。
APMのディテクターとアラートの設定については、Splunk APMでディテクターとアラートを設定する を参照してください。
APMのダッシュボードでのサービス監視の詳細については、「 Splunk APMでダッシュボードを使ってサービスのパフォーマンスを追跡する 」を参照してください。
チャートの作成については、「 Splunk Observability Cloudでチャートを作成する 」を参照してください。
ダッシュボードの作成については、「 ダッシュボードの作成とカスタマイズ 」を参照してください。