Docs » Splunk APMを使用したエラーのトラブルシューティングとアプリケーションパフォーマンスの監視のシナリオ » シナリオ:Kaiが、ある顧客グループ向けのサービスのレイテンシのディテクターを監視する

シナリオ:Kaiが、ある顧客グループ向けのサービスのレイテンシのディテクターを監視する 🔗

架空の企業、Buttercup Gamesのサイト信頼性エンジニアであるKaiは、サービスの問題を最も高い頻度で受けている特定の顧客グループ向けのカートサービスと /getcart エンドポイントの重要な精算ワークフローに影響を与えているレイテンシの問題を監視したいと考えています。

Kaiは、カートサービスのレイテンシを監視するために以下の手順を踏みます:

  1. KaiはMonitoring MetricSet(MMS)を生成し、スパンタグでフィルタリングする

  2. Kaiがサービスレイテンシのディテクターを作成してメトリクスを追跡する

  3. Kaiがカスタムディメンションのチャート、ダッシュボード、アラートを設定する

KaiはMonitoring MetricSet(MMS)を生成し、スパンタグでフィルタリングする 🔗

顧客別にMonitoring MetricSets(MMS)を生成するために、Kaiは各顧客を識別するためにスパンタグにインデックスを付けます: version_id 。次に、 version_id をディメンションとして使用し、MMSを生成します。MMSのスコープを cartservice に設定し、調査したい特定の顧客リストを表す version_id のタグ値でフィルタリングします。

次の画像は、cartservice エンドポイント /getcart のMMS設定例と、version_id のタグ値によるフィルタリングを示しています:

このスクリーンショットは、単一のサービスにカスタムのMonitoring MetricSetを追加する方法を示しています。

Kaiがサービスレイテンシのディテクターを作成してメトリクスを追跡する 🔗

Kaiは、作成したカスタムディメンションMMSを使用して、カートサービスにおけるこの重要な精算ワークフローのパフォーマンスを監視します。これを行うために、Kaiは同じカスタムインデック付きスタグ( version_id )を使用してディテクターを作成し、この精算ワークフローに関連するエラー率を追跡します。

Kaiは、ディテクター作成のガイド付きセットアップに従って、cartservice:GetCart のサービスのエラー率に基づき、version_id のカスタムディメンションでフィルタリングしてディテクターを作成します。

Kaiは、メトリクスファインダーを使用して、システムのメトリクスとメタデータに関する追加情報を検索します。次の画像に示すように、関連するメトリクスを表示するフィルターとして sf_dimensionalized:true を適用します。

このスクリーンショットは、カスタムMMSに関連するメトリクスをメトリクスファインダーでフィルタリングする方法を示しています。

Kaiがカスタムディメンションのチャート、ダッシュボード、アラートを設定する 🔗

またKaiは、作成したカスタムディメンションを使用したチャートやダッシュボードも作成します。

このスクリーンショットは、カスタムのMonitoring MetricSetsに関連するメトリクスをメトリクスファインダーでフィルタリングする方法を示しています。

まとめ 🔗

version_id をカスタムディメンションとして使用したMMSを生成し、問題の影響を受けている顧客にフィルタリングすることで、Kaiは顧客ごとにサービスとエンドポイントのレイテンシを監視するディテクターを設定しました。また、特定の顧客向けのサービスとエンドポイントのレイテンシを経時的に表示するチャートとダッシュボードを作成しました。

さらに詳しく 🔗

このページは 2023年08月22日 に最終更新されました。