AWS Cloudwatchポーリングのトラブルシューティング 🔗
AWS Cloudwatchのポーリング関連の問題が発生した場合は、以下のトピックを参照してください。
注釈
AWSインテグレーションのトラブルシューティング も参照してください。
メトリクスポーリング遅延の計算 🔗
Splunk Observability CloudのCloudWatchデータポイント同期は2つのフェーズで構成されています:
list-metrics
APIの使用による時系列同期
過去3時間以内にアクティブになったすべての時系列 (TS) を同期し、時系列情報をSplunk Observability Cloudの内部ストレージに保存します。
この同期は、各AWSインテグレーションについて15分ごとに実行されます。この間隔は設定できません。
get-metric-data
APIの使用によるデータポイントの同期
Splunk Observability Cloudの内部ストレージに保存されているすべての時系列のすべてのデータポイントを同期します。
この同期は、AWSインテグレーションの設定に応じて1~10分ごとに実行されます。この間隔は設定できます。
注意
Splunk Observability Cloudが特定の時系列から5時間にわたってデータポイントを取得しなかった場合、そのTSは非アクティブとみなされ、Splunk Observability Cloudの内部ストレージから削除されます。
遅延計算の例 🔗
3分のポーリングレートを持つAWSインテグレーションでは、以下の遅延が予想されます:
疎なまたは新しいメトリクスの場合:15分(TS同期)+ 3分(データポイント同期)+ 2-3分(CloudWatchの平均遅延) -> 合計遅延 = 20-21分。
既知の時系列からのデータポイントの場合(TS同期不要):3分(データポイント同期)+ 2-3分(CloudWatchの平均遅延) -> 合計遅延 = 5-6分。
稀なメトリクスに対するペナルティ 🔗
特定の稀なメトリクスのリクエスト数を最小化し、CloudWatch APIコストを削減するために、Splunk Observability Cloudは次の2つの条件を満たす場合、メトリクスを30分間無視します:
get-metric-data
レスポンスには、指定された指標のデータポイントが含まれていません。Splunk Observability Cloudは、最大1時間のルックバックウィンドウを使用して、その特定のメトリクスのデータポイントを取得しようとしました。
稀なメトリクスラグの例 🔗
次の2つのデータポイントを考えてみましょう:
データポイントのタイムスタンプ |
ラグ |
インジェストタイムスタンプ |
---|---|---|
04:39 |
5分 |
04:44 |
05:42 |
37分 |
06:19 |
次のようなことが起きています:
04:44に Splunk Observability Cloudは04:39のデータポイントを取得します。
04:47に、3分間のポーリングレートの後で、Splunk Observability Cloudはこのメトリクスの新しいデータポイントを取得しません。
05:46にSplunk Observability Cloudは最大ルックバックウィンドウを使用します。CloudWatchの内部遅延により、このメトリクスにはまだ新しいデータポイントがないため、メトリクスは30分間無視されます。
06:16になっても、この指標は無視されたままです。
06:19にペナルティが解除され、Splunk Observability Cloudは05:42のデータポイントを取得します。
注釈
設計上、同期の開始時刻は微妙にずれる可能性があり、3分間隔に揃わないこともあります。