APMのMetricSetsについて 🔗
MetricSetsは、Splunk APMでトレースとスパンから計算されるリクエスト率、エラー率、時間といった主要なパフォーマンス指標です。MetricSetsには2つのカテゴリがあります。高カーディナリティのトラブルシューティングに使用されるTroubleshooting MetricSets(TMS)と、リアルタイムの監視に使用されるMonitoring MetricSets(MMS)です。MetricSetsは、Splunk Infrastructure Monitoringでチャートへのデータ投入およびアラートの生成のために使用されるメトリック時系列(MTS)と似ています。詳細は メトリック時系列 を参照してください。MetricSetsは、Splunk APM固有のMTSです。
Monitoring MetricSetsメトリックセットの監視 🔗
Monitoring MetricSets (MMS) are metric time series (MTS) that power the monitoring capabilities in Splunk APM, including charts and dashboards. MMS power the APM landing page and the dashboard view. MMS are also the metrics that detectors monitor to generate alerts.
MMSは、特定のエンドポイント、またはサービス内のすべてのエンドポイントの集合体に対して利用可能です。
Endpoint-level MMS reflect the activity of a single endpoint in a service, while service-level MMS aggregate the activity of all of the endpoints in the service. MMS are created for spans where the span.kind
has a value of SERVER
or CONSUMER
.
次のような場合、スパンは、kind
の値がなかったり、kind
の値が異なったりする可能性があります:
スパンの起点が、自己開始型の操作または推定サービスである場合
インストルメンテーションでエラーが発生した場合
MMSの保存期間 🔗
Splunk Observability Cloudは、MMSをデフォルトで13か月間保存します。
利用可能なデフォルトのMMSのメトリクスとディメンション 🔗
MMS are available for the APM components listed in the following table. Each MMS also has a set of dimensions you can use to monitor and alert on service performance. In addition to the following default MMS, you can create custom MMS to deep dive on your MMS. See カスタムディメンションを使用してMonitoring MetricSetを生成する.
Metric name |
Dimensions |
Custom dimension available? (Yes/No) |
---|---|---|
|
|
あり |
|
|
なし |
|
|
あり |
|
|
なし |
|
|
なし |
Monitoring MetricSets in APM are generated as histogram metrics. Histogram metrics represent a distribution of measurements or metrics, with complete percentile data available. Data is distributed into equally sized intervals, allowing you to compute percentiles across multiple services and aggregate datapoints from multiple metric time series. Histogram metrics provide an advantage over other metric types when calculating percentiles, such as the p90 percentile for a single MTS. See more in メトリクスタイプ. For histogram MMS, there is a single metric for each component.
Previously, MMS were classified as either a counter or gauge metric type. The previous MMS included 6 metrics for each component.
説明 |
ヒストグラムMMS |
MMS (deprecated) |
---|---|---|
リクエスト数 |
|
|
リクエスト時間の最小値 |
|
|
リクエスト時間の最大値 |
|
|
リクエスト時間の中央値 |
|
|
リクエスト時間のパーセンタイル |
|
|
リクエスト時間のパーセンタイル |
|
|
Example metrics in APM 🔗
A histogram MTS uses the following syntax using SignalFlow:
histogram(metric=<metric_name>[,filter=<filter_dict>][,resolution=<resolution>)
The following table displays example SignalFlow functions:
説明 |
ヒストグラムMMS |
Previous MMS (deprecated) |
---|---|---|
Aggregate count of all MTS |
|
|
P90 percentile for single MTS |
|
|
Combined p90 for multiple services |
|
|
注釈
Because an aggregation is applied on histogram(), to display all of the metric sets separately, each dimension needs to be applied as a groupby.
Splunk APM内でMMSを使用する 🔗
Splunk APM内でアラートとリアルタイム監視のためにMMSを使用します。Monitoring MetricSetsに基づいてチャート、ダッシュボード、アラートを作成できます。
タスク |
ドキュメント |
---|---|
チャートの作成 |
|
ダッシュボードの作成 |
|
アラートの作成 |
|
APMダッシュボードでのサービスの監視 |
Troubleshooting MetricSets 🔗
Troubleshooting MetricSets(TMS)は、APMでカーディナリティの高いIDのトラブルシューティングに使用できるメトリック時系列(MTS)です。TMSは、スパンやワークフロー間の履歴比較を行うためにも使用できます。
Splunk APMは、デフォルトでいくつかのスパンタグをインデックス化しTroubleshooting MetricSetsを作成します。これらの各タグの詳細については、APMのデフォルトのインデックス付きスパンタグ を参照してください。APMによるこれらのスパンタグのインデックス化を変更したり停止したりすることはできません。
追加のスパンタグやプロセスをインデックス化することで、カスタムTMSを作成することもできます。スパンタグやプロセスをインデックス化して新しいTroubleshooting MetricSetsを作成する方法については、スパンタグをインデックス化してTroubleshooting MetricSetsを作成する を参照してください。
利用可能なTMSメトリクス 🔗
すべてのTMSは、以下のメトリクスを作成します。これは、リクエスト、エラーおよび時間(RED)メトリクスと呼ばれます。REDメトリクスは、サービスマップ内でサービスを選択すると表示されます。サービスマップ内でのREDメトリクスの使用方法の詳細については、シナリオ:KaiがSplunk APMのサービスマップを使用してエラーの根本原因を調査する を参照してください。
リクエスト率
エラー率
根本原因エラー率
P50、P90、P99レイテンシ
Troubleshooting MetricSetsの測定精度は10秒です。Splunk APMは、各10秒のレポートウィンドウについて、メトリクスの分散から分位数をレポートします。
Splunk APM内でTMSを使用する 🔗
TMSは、サービスマップとTag Spotlightに表示されます。TMSを使用して、サービスマップをフィルタリングしたり、指定したインデックス済みのスパンタグまたはプロセスの値について内訳を作成したりできます。
サービスマップでサービス間の依存関係を表示する および Tag Spotlightを使用してサービスパフォーマンスを分析する を参照してください。
TMSの保存期間 🔗
Splunk Observability Cloudは、生のトレースと同じ期間にわたってTMSを保持します。デフォルトでは、保持期間は8日間です。
Troubleshooting MetricSetsの詳細については、スパンタグとTroubleshooting MetricSetsのリファレンスおよびベストプラクティス を参照してください。
Monitoring MetricSetsとTroubleshooting MetricSetsの比較 🔗
エンドポイントレベルのMMSとサービスレベルのMMSにはTMSメトリクスのサブセットが含まれるため、Splunk APMでのコンテキストによってサービスのメトリクス値が異なることに気づくかもしれません。これは、MMSがダッシュボードビューのベースであり、MMSの kind
には SERVER
または CONSUMER
しかないためです。対照的に、TMSはトラブルシューティングビューおよびTag Spotlightビューのベースであり、TMSは特定のメトリクスに限定されません。
例えば、ホストダッシュボードに表示される checkout
サービスのメトリクスの値は、サービスマップに表示されるメトリクスの値と異なる場合があります。これは、このサービスに関連するスパンの kind
の値が複数存在し、ダッシュボードを動かすMMSがそれを監視していないためです。
MMSとTMSを直接比較するには、特定のエンドポイントにフィルタリングすることでTMSをエンドポイントのみのデータに制限します。また、サービスマップをエンドポイントごと分解することもできます。