Docs » Splunk APMでサービス、スパン、トレースを管理する » Splunk APMのTrace Analyzerを使用してトレースを調査する

Splunk APMのTrace Analyzerを使用してトレースを調査する 🔗

Trace Analyzerを使用すると、アプリケーションによって生成されたトレースを検索し、どのタグが関連するのかを事前に把握していなくとも、完全忠実のトレースデータ内のパターンを特定できます。

Trace Analyzerは、Splunk Application Performance Monitoring(APM)のすべてのユーザーが利用できます。

Trace Analyzerを使用すると、以下のような疑問の解決に役立ちます:

  • 特定のサービス、環境、タグの組み合わせについて、いくつのトレースおよびエラートレースが存在するか?

  • 特定の問題について、どの顧客で最も高いエラー率が発生しているか?

  • トレースデータ内でエラーの急上昇を見つける方法は?

  • 顧客に遅延の問題が発生しているタイミングと場所は?

  • 遅延の影響を受けている顧客の数は?

Trace Analyzerを使用するタイミング 🔗

Splunk Observability Cloudは、アプリケーション監視データを調査するためのツールをいくつか提供しています。Trace Analyzerは、未知の問題や新しい問題の調査のためにカーディナリティが高く粒度の高い検索や調査が必要となるシナリオに適しています。低カーディナリティと高カーディナリティのデータを扱うためのガイドライン を参照してください。

次のテーブルは、各APMツールが何に最適かを示すものです:

APMツール

シナリオ

分析レベル

カーディナリティ

ドキュメント

Trace Analyzer

インデックス化されていないタグのパターンの特定

トレースレベルの分析

高いカーディナリティ

Tag Spotlightとサービスマップ

インデックス化されたタグの傾向の表示

サービスレベルの分析

中程度のカーディナリティ

Tag Spotlightを使用してサービスパフォーマンスを分析する

Monitoring MetricSetsメトリックセットの監視

サービスの低下に関するアラートの取得

ワークフローとサービスレベルの分析

低いカーディナリティ

カスタムディメンションを使用してMonitoring MetricSetsを生成する

トレースデータを調査する 🔗

Trace Analyzerを開くには、Splunk APMで Traces を選択し、Switch to Trace Analyzer を選択します。従来の[トレース]ページに戻るには、Switch to Classic View を選択します。従来のトレースビューの詳細については 従来の「トレース」ページを使用してトレースを調査する を参照してください。

トレースデータを調査するには、以下のコントロールを使用します。画像内のコールアウトとして、各コントロールに番号を付けています。各コールアウトの追加情報は、画像の次にあります。

Trace Analyzerのユーザーインターフェイスの要素(この画像の後にあるリストで説明)
  1. フィルターバーを使用して、時間範囲、環境、ワークフロー、サービス、およびタグでトレースを絞り込みます。

  2. トレースビューの選択機能を使用して、チャート内のトレースおよびエラーのカウントまたは期間を選択します。

  3. トレース時間の最小値および最大値を使用して、その期間に含まれるトレースを絞り込みます。

  4. サンプル比率を使用して、すべてのトレースまたは10%のトレースを選択します。デフォルトでは、サンプル比率は1:10に設定されています。一度選択すると、選択内容は保持されます。

  5. Errors Only スイッチを使用して、エラーのあるトレースだけを表示します。

  6. サーチを使用して、IDでトレースを検索します。

  7. リアルタイムチャートを使用し、選択した内容に応じて、エラーを含むトレース総数のカウントやトレース期間のヒートマップを表示します。

  8. トレースのテーブルを使用して、トレースの詳細を表示したり、タグに基づいてメトリクスをグループ化したりします。

Trace Analyzerは、デフォルトの保持期間である8日間のすべてのトレースを検索します。デフォルトのトレース保持期間については、Application Performance Monitoring(APM)のデータ保持 を参照してください。

トレースとエラーのカウントを調べる 🔗

Trace & error count を表示する場合、リアルタイムチャートには、トレースおよびエラーを含むトレースの合計が積上げ棒グラフで表示されます。グラフのバーを選択してドラッグすると、利用可能な時間枠の中から特定の期間を選択できます。時間範囲フィルターを更新するには、時間範囲フィルターを更新するには、Filter to selection を選択します。

ユーザーが特定の時間フレームを選択し、「フィルター」の選択内容を選択すると、より詳細なビューが表示されます。

トレース期間を調査する 🔗

Trace Duration を表示する場合、リアルタイムチャートには、トレース期間別のヒートマップがされます。このヒートマップは3次元のデータを表します:

  1. X軸に時間

  2. Y軸にトレース期間

  3. 1秒あたりのトレース数(リクエスト数)は、ヒートマップの濃淡で表されます

チャートのバーを選択してドラッグし、特定の期間とトレース期間の範囲を選択します。Filter to selection を選択して、時間範囲フィルターと最小期間および最大期間のフィルターを追加します。

ヒートマップの濃淡を描写する1秒あたりのトレース数は、フィルターに基づいて範囲内のデータに対してスケーリングされるため、1秒あたりのトレース数の凡例値はフレーム内のデータに基づいて変化します。

ユーザーが特定の時間フレームとトレース期間範囲を選択し、「フィルター」の選択内容を選択すると、より詳細なビューが表示されます。

タグ別にグループメトリクスを表示する 🔗

利用可能なすべてのトレースを単一のタグまたは属性でグループ化できます。例えば、データベーステーブル、ホスト名、HTTPステータスコードによって、サービスからのすべてのトレースをグループ化することができます。

Trace Analyzerのタグ選択メニュー

結果として表示される Group Metrics タブには、選択したタグの上位100個の値の内訳が、エラーの数でランク付けされて表示されます。

Trace Analyzerのメトリクステーブル

両方のテーブルは、一致するトレースの数で並べることができます。

Trace Analyzerのトレースの制限 🔗

Trace Analyzerは、最大6時間のデータを検索することができます。

Trace Analyzerのインターフェイスには、次の画像内に番号を付けたとおりに、3つの異なる表示制限があります。

  1. The Trace Analyzer chart displays at least 1,000 traces and at least 6 hours of traces. After there are 1,000 traces and 6 hours of trace data, the trace search stops.

  2. The Group Metrics tab displays at least 1,000 traces and at least 6 hours of traces. After there are 1,000 traces and 6 hours of trace data, the trace search stops.

  3. The list of traces displayed on the Traces tab has a limit of 1,000 traces. Trace Analyzer searches for traces at the end of the time window you select. When 1,000 traces are matched, the list stops populating.

Trace Analyzerのユーザーインターフェースのうち、トレースの制限があるもの(この画像の後にあるリストで説明)

さらに詳しく 🔗

Trace AnalyzerおよびSplunk APMのトレースに関する詳細は、以下のリンクを参照してください:

This page was last updated on 2024年05月10日.