Splunk APMのTrace Analyzerを使用してトレースを調査する 🔗
Trace Analyzerを使用すると、アプリケーションによって生成されたトレースを検索し、どのタグが関連するのかを事前に把握していなくとも、完全忠実のトレースデータ内のパターンを特定できます。
Trace Analyzerは、Splunk Application Performance Monitoring(APM)のすべてのユーザーが利用できます。
Trace Analyzerを使用すると、以下のような疑問の解決に役立ちます:
特定のサービス、環境、タグの組み合わせについて、いくつのトレースおよびエラートレースが存在するか?
特定の問題について、どの顧客で最も高いエラー率が発生しているか?
トレースデータ内でエラーの急上昇を見つける方法は?
顧客に遅延の問題が発生しているタイミングと場所は?
遅延の影響を受けている顧客の数は?
Trace Analyzerを使用するタイミング 🔗
Splunk Observability Cloudは、アプリケーション監視データを調査するためのツールをいくつか提供しています。Trace Analyzerは、未知の問題や新しい問題の調査のためにカーディナリティが高く粒度の高い検索や調査が必要となるシナリオに適しています。低カーディナリティと高カーディナリティのデータを扱うためのガイドライン を参照してください。
次のテーブルは、各APMツールが何に最適かを示すものです:
APMツール |
シナリオ |
分析レベル |
カーディナリティ |
ドキュメント |
---|---|---|---|---|
Trace Analyzer |
インデックス化されていないタグのパターンの特定 |
トレースレベルの分析 |
高いカーディナリティ |
|
Tag Spotlightとサービスマップ |
インデックス化されたタグの傾向の表示 |
サービスレベルの分析 |
中程度のカーディナリティ |
|
Monitoring MetricSetsメトリックセットの監視 |
サービスの低下に関するアラートの取得 |
ワークフローとサービスレベルの分析 |
低いカーディナリティ |
トレースデータを調査する 🔗
Trace Analyzerを開くには、Splunk APMで Traces を選択し、Switch to Trace Analyzer を選択します。従来の[トレース]ページに戻るには、Switch to Classic View を選択します。従来のトレースビューの詳細については 従来の「トレース」ページを使用してトレースを調査する を参照してください。
トレースデータを調査するには、以下のコントロールを使用します。画像内のコールアウトとして、各コントロールに番号を付けています。各コールアウトの追加情報は、画像の次にあります。
Use the filter bar to refine the traces by time range, environment, workflow, services, and tags. For tag filters, both equal to (
=
) and not equal to (!=
) operators are available.トレース時間の最小値および最大値を使用して、その期間に含まれるトレースを絞り込みます。
サンプル比率を使用して、すべてのトレースまたは10%のトレースを選択します。デフォルトでは、サンプル比率は1:10に設定されています。一度選択すると、選択内容は保持されます。
Errors Only スイッチを使用して、エラーのあるトレースだけを表示します。
サーチを使用して、IDでトレースを検索します。
リアルタイムチャートを使用し、選択した内容に応じて、エラーを含むトレース総数のカウントやトレース期間のヒートマップを表示します。
トレースのテーブルを使用して、トレースの詳細を表示したり、タグに基づいてメトリクスをグループ化したりします。
Trace Analyzerは、デフォルトの保持期間である8日間のすべてのトレースを検索します。デフォルトのトレース保持期間については、Application Performance Monitoring(APM)のデータ保持 を参照してください。
トレースとエラーのカウントを調べる 🔗
Trace & error count を表示する場合、リアルタイムチャートには、トレースおよびエラーを含むトレースの合計が積上げ棒グラフで表示されます。グラフのバーを選択してドラッグすると、利用可能な時間枠の中から特定の期間を選択できます。時間範囲フィルターを更新するには、時間範囲フィルターを更新するには、Filter to selection を選択します。
トレース期間を調査する 🔗
Trace Duration を表示する場合、リアルタイムチャートには、トレース期間別のヒートマップがされます。このヒートマップは3次元のデータを表します:
X軸に時間
Y軸にトレース期間
1秒あたりのトレース数(リクエスト数)は、ヒートマップの濃淡で表されます
チャートのバーを選択してドラッグし、特定の期間とトレース期間の範囲を選択します。Filter to selection を選択して、時間範囲フィルターと最小期間および最大期間のフィルターを追加します。
ヒートマップの濃淡を描写する1秒あたりのトレース数は、フィルターに基づいて範囲内のデータに対してスケーリングされるため、1秒あたりのトレース数の凡例値はフレーム内のデータに基づいて変化します。
タグ別にグループメトリクスを表示する 🔗
利用可能なすべてのトレースを単一のタグまたは属性でグループ化できます。例えば、データベーステーブル、ホスト名、HTTPステータスコードによって、サービスからのすべてのトレースをグループ化することができます。
結果として表示される Group Metrics タブには、選択したタグの上位100個の値の内訳が、エラーの数でランク付けされて表示されます。
両方のテーブルは、一致するトレースの数で並べることができます。
Trace Analyzerのトレースの制限 🔗
Trace Analyzerのインターフェイスには、次の画像内に番号を付けたとおりに、3つの異なる表示制限があります。
- Trace Analyzerチャートの制限は、使用するフィルターと選択するチャートによって異なります:
時間範囲、環境、ワークフロー、およびサービスのフィルターを組み合わせて使用する場合、Trace & error count チャートには8日間のトレースが表示されます。
操作フィルターまたはタグフィルターのいずれかを使用する場合、Trace & error count チャートには最低1,000個のトレースかつ最低6時間のトレースが表示されます。トレースが1,000個かつトレースデータが6時間に達すると、トレース検索は停止します。
Trace duration チャートには、最低1,000個のトレースかつ最低6時間のトレースが表示されます。トレースが1,000個かつトレースデータが6時間に達すると、トレース検索は停止します。
Group Metrics タブには、最低1,000個のトレースかつ最低6時間のトレースが表示されます。トレースが1,000個かつトレースデータが6時間に達すると、トレース検索は停止します。
The list of traces displayed on the Traces tab has a limit of 1,000 traces. Trace Analyzer searches for traces at the end of the time window you select. When 1,000 traces are matched, the list stops populating.
Trace Analyzerで可視性フィルターAPIを使用する際の注意点 🔗
Splunk APMで可視性フィルターAPIを使用して特定のスパンタグをブロックする場合、Trace Analyzerでは以下のような表示になります:
可視性フィルターAPIで
hiddenTags
フィールドを使用してタグを非表示にした場合、フィルターバーやトレースのグループ化でこれらのタグを使用することはできません。可視性フィルターAPIで
visibleTags
フィールドを使用して可視タグを指定した場合、フィルターバーやトレースのグループ化ではその可視タグのみを使用できます。
可視性フィルターの詳細については、Splunk APMで可視性フィルターAPIを使用してデータをブロックする およびSplunk開発者ガイドの「 APMの可視性フィルター 」を参照してください。
さらに詳しく 🔗
Trace AnalyzerおよびSplunk APMのトレースに関する詳細は、以下のリンクを参照してください: