APMのMetricSetsについて 🔗
MetricSetsは、Splunk APMでトレースとスパンから計算されるリクエスト率、エラー率、時間といった主要なパフォーマンス指標です。MetricSetsには2つのカテゴリがあります。高カーディナリティのトラブルシューティングに使用されるTroubleshooting MetricSets(TMS)と、リアルタイムの監視に使用されるMonitoring MetricSets(MMS)です。MetricSetsは、Splunk Infrastructure Monitoringでチャートへのデータ投入およびアラートの生成のために使用されるメトリック時系列(MTS)と似ています。詳細は メトリック時系列 を参照してください。MetricSetsは、Splunk APM固有のMTSです。
Troubleshooting MetricSets 🔗
Troubleshooting MetricSets(TMS)は、APMでカーディナリティの高いIDのトラブルシューティングに使用できるメトリック時系列(MTS)です。TMSは、スパンやワークフロー間の履歴比較を行うためにも使用できます。
Splunk APMは、デフォルトでいくつかのスパンタグをインデックス化しTroubleshooting MetricSetsを作成します。これらの各タグの詳細については、APMのデフォルトのインデックス付きスパンタグ を参照してください。APMによるこれらのスパンタグのインデックス化を変更したり停止したりすることはできません。
追加のスパンタグやプロセスをインデックス化することで、カスタムTMSを作成することもできます。スパンタグやプロセスをインデックス化して新しいTroubleshooting MetricSetsを作成する方法については、スパンタグをインデックス化してTroubleshooting MetricSetsを作成する を参照してください。
利用可能なTMSメトリクス 🔗
すべてのTMSは、以下のメトリクスを作成します。これは、リクエスト、エラーおよび時間(RED)メトリクスと呼ばれます。REDメトリクスは、サービスマップ内でサービスを選択すると表示されます。サービスマップ内でのREDメトリクスの使用方法の詳細については、シナリオ:KaiがSplunk APMのサービスマップを使用してエラーの根本原因を調査する を参照してください。
リクエスト率
エラー率
根本原因エラー率
P50、P90、P99レイテンシ
Troubleshooting MetricSetsの測定精度は10秒です。Splunk APMは、各10秒のレポートウィンドウについて、メトリクスの分散から分位数をレポートします。
Splunk APM内でTMSを使用する 🔗
TMSは、サービスマップとTag Spotlightに表示されます。TMSを使用して、サービスマップをフィルタリングしたり、指定したインデックス済みのスパンタグまたはプロセスの値について内訳を作成したりできます。
サービスマップでサービス間の依存関係を表示する および Tag Spotlightを使用してサービスパフォーマンスを分析する を参照してください。
TMSの保存期間 🔗
Splunk Observability Cloudは、生のトレースと同じ期間にわたってTMSを保持します。デフォルトでは、保持期間は8日間です。
Troubleshooting MetricSetsの詳細については、スパンタグとTroubleshooting MetricSetsのリファレンスおよびベストプラクティス を参照してください。
Monitoring MetricSetsメトリックセットの監視 🔗
Monitoring MetricSets(MMS)は、チャートやダッシュボードといったSplunk APMでのリアルタイム監視機能を強化するメトリック時系列(MTS)です。MMSは、APMのリアルタイムのランディングページとダッシュボードビューに動力を供給します。またMMSは、アラートを生成するためにディテクターが監視するメトリクスでもあります。
MMSは、特定のエンドポイント、またはサービス内のすべてのエンドポイントの集合体に対して利用可能です。
エンドポイントレベルのMMSはサービス内の単一のエンドポイントのアクティビティを反映し、サービスレベルのMMSはサービス内のすべてのエンドポイントのアクティビティを集約します。MMSは、span.kind
の値が SERVER
または CONSUMER
であるスパンのみに限定されます。
次のような場合、スパンは、kind
の値がなかったり、kind
の値が異なったりする可能性があります:
スパンの起点が、自己開始型の操作または推定サービスである場合
インストルメンテーションでエラーが発生した場合
以下のデフォルトのMMSに加えて、カスタムMMSを作成することができます。カスタムディメンションを使用してMonitoring MetricSetを生成する を参照してください。
利用可能なデフォルトのMMSのメトリクスとディメンション 🔗
MMSは以下のAPMコンポーネントで利用できます:
service.request
スパン
inferred.services
トレース
ワークフロー(ワークフローメトリクスは、ビジネスワークフローを作成するとデフォルトで作成されます。カスタムMMSは、ビジネスワークフローでは使用できません。)
各MMSは、各コンポーネントに対する6つのメトリクスを含みます。ヒストグラムMMSでは、各コンポーネントに対して1つのメトリクスがあります。使用したい特定のヒストグラムバケツにアクセスするには、ヒストグラム関数を使用します。
各メトリクスに対して、レスポンスが sf_error: true
または sf_error: false
のメトリック時系列(MTS)が1つ存在します。
説明 |
MMS |
ヒストグラムMMS |
---|---|---|
リクエスト数 |
|
|
リクエスト時間の最小値 |
|
|
リクエスト時間の最大値 |
|
|
リクエスト時間の中央値 |
|
|
リクエスト時間のパーセンタイル |
|
|
リクエスト時間のパーセンタイル |
|
|
各MMSには、サービスパフォーマンスの監視とアラートに使用できるディメンションのセットがあります。
サービスディメンション 🔗
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_error
推定サービスディメンション 🔗
sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_error
sf.kind
スパンディメンション 🔗
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_operation
sf_kind
sf_error
sf_httpMethod
(該当する場合)
トレースディメンション 🔗
注釈
トレースディメンションは、カスタムMMSではサポートされません。
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_service
service.name
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_operation
sf_httpMethod
sf_error
ワークフローディメンション 🔗
ワークフローのメトリクスとディメンションは、ビジネスワークフローを作成するとデフォルトで作成されます。
注釈
ワークフローディメンションは、カスタムMMSではサポートされません。
sf_environment
deployment.environment
- このディメンションは、ヒストグラムMMSでのみ利用可能です。sf_workflow
sf_error
Splunk APM内でMMSを使用する 🔗
Splunk APM内でアラートとリアルタイム監視のためにMMSを使用します。Monitoring MetricSetsに基づいてチャート、ダッシュボード、アラートを作成できます。
タスク |
ドキュメント |
---|---|
チャートの作成 |
|
ダッシュボードの作成 |
|
アラートの作成 |
|
APMダッシュボードでのサービスの監視 |
MMSの保存期間 🔗
Splunk Observability Cloudは、MMSをデフォルトで13か月間保存します。
Monitoring MetricSetsとTroubleshooting MetricSetsの比較 🔗
エンドポイントレベルのMMSとサービスレベルのMMSにはTMSメトリクスのサブセットが含まれるため、Splunk APMでのコンテキストによってサービスのメトリクス値が異なることに気づくかもしれません。これは、MMSがダッシュボードビューのベースであり、MMSの kind
には SERVER
または CONSUMER
しかないためです。対照的に、TMSはトラブルシューティングビューおよびTag Spotlightビューのベースであり、TMSは特定のメトリクスに限定されません。
例えば、ホストダッシュボードに表示される checkout
サービスのメトリクスの値は、サービスマップに表示されるメトリクスの値と異なる場合があります。これは、このサービスに関連するスパンの kind
の値が複数存在し、ダッシュボードを動かすMMSがそれを監視していないためです。
MMSとTMSを直接比較するには、特定のエンドポイントにフィルタリングすることでTMSをエンドポイントのみのデータに制限します。また、サービスマップをエンドポイントごと分解することもできます。