APMのMetricSetsについて 🔗
MetricSets are key performance indicators, like request rate, error rate, and request duration, that are calculated from traces and spans in Splunk APM. There are 2 categories of MetricSets: Troubleshooting MetricSets (TMS), used for high-cardinality troubleshooting, and Monitoring MetricSets (MMS), used for real-time monitoring. MetricSets are similar to the metric time series (MTS) used in Splunk Infrastructure Monitoring to populate charts and generate alerts. See メトリック時系列 to learn more. MetricSets are MTS that are specific to Splunk APM.
Troubleshooting MetricSets 🔗
Troubleshooting MetricSets (TMS) are metric time series (MTS) you can use for troubleshooting high-cardinality identities in APM. You can also use TMS to make historical comparisons across spans and workflows.
Splunk APM indexes and creates Troubleshooting MetricSets for several span tags by default. For more details about each of these tags, see APMのデフォルトのインデックス付きスパンタグ. You can’t modify or stop APM from indexing these span tags.
You can also create custom TMS by indexing additional span tags and processes. To learn how to index span tags and processes to create new Troubleshooting MetricSets, see Index span tags to create Troubleshooting MetricSets.
利用可能なTMSメトリクス 🔗
Every TMS creates the following metrics, known as request, error, and duration (RED) metrics. RED metrics appear when you select a service in the service map. See シナリオ:KaiがSplunk APMのサービスマップを使用してエラーの根本原因を調査する to learn more about using RED metrics in the service map.
リクエスト率
エラー率
根本原因エラー率
P50、P90、P99レイテンシ
Troubleshooting MetricSetsの測定精度は10秒です。Splunk APMは、各10秒のレポートウィンドウについて、メトリクスの分散から分位数をレポートします。
Use TMS within Splunk APM 🔗
TMS appear on the service map and in Tag Spotlight. Use TMS to filter the service map and create breakdowns across the values of a given indexed span tag or process.
See サービスマップでサービス間の依存関係を表示する and Tag Spotlightを使用してサービスパフォーマンスを分析する.
TMS retention period 🔗
Splunk Observability Cloud retains TMS for the same amount of time as raw traces. By default, the retention period is 8 days.
Troubleshooting MetricSetsの詳細については、スパンタグとTroubleshooting MetricSetsのリファレンスおよびベストプラクティス を参照してください。
Monitoring MetricSetsメトリックセットの監視 🔗
Monitoring MetricSets (MMS) are metric time series (MTS) that power the real-time monitoring capabilities in Splunk APM, including charts and dashboards. MMS power the APM landing page and the dashboard view. MMS are also the metrics that detectors monitor to generate alerts.
MMSは、特定のエンドポイント、またはサービス内のすべてのエンドポイントの集合体に対して利用可能です。
Endpoint-level MMS reflect the activity of a single endpoint in a service, while service-level MMS aggregate the activity of all of the endpoints in the service. MMS are limited to spans where the span.kind
has a value of SERVER
or CONSUMER
.
次のような場合、スパンは、kind
の値がなかったり、kind
の値が異なったりする可能性があります:
スパンの起点が、自己開始型の操作または推定サービスである場合
インストルメンテーションでエラーが発生した場合
以下のデフォルトのMMSに加えて、カスタムMMSを作成することができます。Create a Monitoring MetricSet with a custom dimension を参照してください。
Available default MMS metrics and dimensions 🔗
MMSは以下のAPMコンポーネントで利用できます:
service.request
spans
inferred.services
traces
workflows (Workflow metrics are created by default when you create a Business Workflow. Custom MMS are not available for Business Workflows.)
各MMSは、各コンポーネントに対する6つのメトリクスを含みます。ヒストグラムMMSでは、各コンポーネントに対して1つのメトリクスがあります。使用したい特定のヒストグラムバケツにアクセスするには、ヒストグラム関数を使用します。
For each metric, there is 1 metric time series (MTS) with responses sf_error: true
or sf_error: false
.
説明 |
MMS |
ヒストグラムMMS |
---|---|---|
Request count |
|
|
Minimum request duration |
|
|
Maximum request duration |
|
|
Median request duration |
|
|
Percentile request duration |
|
|
Percentile request duration |
|
|
Each MMS has a set of dimensions you can use to monitor and alert on service performance.
Service dimensions 🔗
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_error
Inferred service dimensions 🔗
sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_error
sf.kind
Span dimensions 🔗
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_operation
sf_kind
sf_error
sf_httpMethod
(該当する場合)
Trace dimensions 🔗
注釈
トレースディメンションは、カスタムMMSではサポートされません。
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_operation
sf_httpMethod
sf_error
Workflow dimensions 🔗
Workflow metrics and dimensions are created by default when you create a Business Workflow.
注釈
ワークフローディメンションは、カスタムMMSではサポートされません。
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_workflow
sf_error
Use MMS within Splunk APM 🔗
Splunk APM内でアラートとリアルタイム監視のためにMMSを使用します。Monitoring MetricSetsに基づいてチャート、ダッシュボード、アラートを作成できます。
タスク |
ドキュメント |
---|---|
チャートの作成 |
|
ダッシュボードの作成 |
|
アラートの作成 |
|
APMダッシュボードでのサービスの監視 |
MMS retention period 🔗
Splunk Observability Cloud stores MMS for 13 months by default.
Monitoring MetricSetsとTroubleshooting MetricSetsの比較 🔗
Because endpoint-level and service-level MMS include a subset of the TMS metrics, you might notice that metric values for a service are different depending on the context in Splunk APM. This is because MMS are the basis of the dashboard view and MMS can only have a kind
of SERVER
or CONSUMER
. In contrast, TMS are the basis of the troubleshooting and Tag Spotlight views and TMS aren’t restricted to specific metrics.
例えば、ホストダッシュボードに表示される checkout
サービスのメトリクスの値は、サービスマップに表示されるメトリクスの値と異なる場合があります。これは、このサービスに関連するスパンの kind
の値が複数存在し、ダッシュボードを動かすMMSがそれを監視していないためです。
To compare MMS and TMS directly, restrict your TMS to endpoint-only data by filtering to a specific endpoint. You can also break down the service map by endpoint.