Splunk Observability Cloudの組織のメトリクスを表示する 🔗
Splunk Observability Cloudは具体的なメトリクスを提供するため、組織のプラットフォームの使用状況を測定することができます。
組織のメトリクスには以下が含まれます:
取り込みのメトリクス:送信したデータポイントの数など、Infrastructure Monitoringに送信しているデータを測定します。
アプリ使用状況のメトリクス:組織内のダッシュボードの数など、アプリケーション機能の使用状況を測定します。
インテグレーションのメトリクス:AWS CloudWatch APIへのコール数など、組織と統合されたクラウドサービスの使用状況を測定します。
リソースのメトリクス:作成したカスタムメトリック時系列(MTS)の数など、制限を指定できるリソースの使用状況を測定します。
これらのメトリクスの使用について料金は発生しません。また、これらは システムの制限 にカウントされません。
組織のメトリクスへのアクセス 🔗
管理者の場合は、「組織の概要」ページの組み込みチャートでこれらのメトリクスの一部を表示できます。すべてのユーザーは、カスタムチャートでこれらのメトリクスを表示できます。
「組織の概要」ページにアクセスするには、以下の手順に従ってください:
Splunk Observability Cloud にログインします。
左側のナビで、設定 を選択し、組織の概要 を選択します。
表示したいメトリクスのタブを選択します:
エンゲージメント:ユーザーと、ユーザーが作成したチャート、ディテクター、ダッシュボード、ダッシュボードグループ、チームに関するメトリクス。
APMエンタイトルメント:APMのトラブルシューティング用。
APMのスロットリング;組織内のスロットリングと制限を追跡するメトリクスを強調表示するチャート。
IMエンタイトルメント:IMのトラブルシューティング用。
IMシステム制限:組織内のシステム制限の使用状況を追跡するメトリクスを特定するチャート。
IMのスロットリング;組織内のスロットリングと制限を追跡するメトリクスを強調表示するチャート。
クラウドインテグレーション:クラウドプロバイダーAPIからのテレメトリ収集を制限する可能性のあるエラーとスロットリングを追跡するメトリクスを強調表示するチャート。
組織のメトリクスの解釈と活用 🔗
このセクションでは、使用状況に関するメトリクスの解釈と活用に役立つヒントを提供します。
データ制限、データスロットリング、データフィルタリング 🔗
システム制限を追跡するメトリクス および データのスロットリングを追跡するメトリクス で説明されているように、ご利用のプランのエンタイトルメントまたはシステムの制限を超えた場合、データは、制限またはスロットリングされます。
また、データはプラットフォームからフィルタリングされ、特定の組織メトリクス値 で追跡することができます:
データは、SignalFxエクスポーター など、特定のコンポーネントで自動的にフィルタリングすることができます。
無効なデータもプラットフォームに到達するとフィルタリングされます。例えば、メトリクス名や値がないデータポイントは無効であり、除外されます。トレースやスパンIDのないスパンも同様です。
gross
と num
のメトリクス値の比較 🔗
メトリクスの中には、 gross
値と num
値をレポートするものがあります。メトリクスの gross
と num
の値を比較して、システムがデータを制限またはフィルタリングしているかどうかを確認します。
gross
メトリクスは、スロットリングやフィルタリングが作動する前にシステムが受信するデータポイントの総数をレポートします。num
メトリクスは、システムがスロットリングまたはフィルタリングを完了した後に受信するデータポイントの総数をレポートします。
システム制限を追跡するメトリクス 🔗
これらのメトリクスは、Infrastructure Monitoringが組織に課す制限を追跡します。これらの制限を超えると、データが除外されることがあります。
sf.org.limit.activeTimeSeries
(ゲージ):過去25時間の移動窓内で、組織が持つことができるアクティブなMTSの最大数。この制限を超えると、Infrastructure Monitoringは新しいMTSのデータポイントの受け入れを停止しますが、既存のMTSのデータポイントの受け入れは継続します。この制限に対する使用状況を監視するには、sf.org.numActiveTimeSeries
のメトリクスを使用します。sf.org.limit.containers
(ゲージ):組織にデータを送信できるコンテナの最大数。この制限は、バーストおよび超過使用を許容できるようにするため、契約上の上限よりも高く設定されています。この制限を超えると、Infrastructure Monitoringは新しいコンテナからのデータポイントを除外しますが、既存のコンテナのデータポイントの受け入れは継続します。この制限に対する使用状況を監視するには、sf.org.numResourcesMonitored
メトリクスとresourceType:containers
ディメンションのフィルターを使用します。sf.org.limit.computationsPerMinute
(ゲージ):1分あたりのSignalFlowの最大計算回数。sf.org.limit.customMetricMaxLimit
(ゲージ):過去60分間の移動窓内で、組織にデータを送信できるアクティブなカスタムMTSの最大数。この制限を超えると、Infrastructure Monitoringは、制限を超えたカスタムMTSのデータポイント を除外しますが、すでに存在していたカスタムMTSのデータポイントの受け入れは継続します。sf.org.numCustomMetrics
で定義したカスタムメトリクスを参照してください。カスタムMTSの詳細は、カスタムメトリクスとバンドルメトリクスについて を参照してください。
sf.org.limit.customMetricTimeSeries
(ゲージ):アクティブなカスタムMTSの最大数。sf.org.limit.detector
(ゲージ):組織に使用できるディテクターの最大数。この上限に達すると、新しいディテクターを作成できなくなります。作成するディテクターの数を監視するには、sf.org.num.detector
のメトリクスを使用します。sf.org.limit.eventsPerMinute
(ゲージ):1分あたりの受信イベントの最大数。sf.org.limit.hosts
(ゲージ):組織にデータを送信できるホストの最大数。この制限は、バーストおよび超過使用を許容するために、契約上の上限よりも高く設定されています。この制限を超えると、Infrastructure Monitoringは新しいホストからのデータポイントを除外しますが、既存のホストのデータポイントの受け入れは継続します。この制限に対する使用状況を監視するには、sf.org.numResourcesMonitored
メトリクスとresourceType:hosts
ディメンションのフィルターを使用します。sf.org.limit.metricTimeSeriesCreatedPerMinute
(ゲージ):組織での新規MTS作成の最大レート。1分あたりのMTSで測定されます。このレートを超えると、Infrastructure Monitoringは新しいMTSのデータポイントの受け入れを停止しますが、既存のMTSのデータポイントの受け入れは継続します。作成したメトリクスの総数を監視するには、sf.org.numMetricTimeSeriesCreated
のメトリクスを使用します。
データのスロットリングを追跡するメトリクス 🔗
前のセクションで説明したように、特定のシステム制限は、「上限」、つまりSplunk Observability Cloudで許可される要素の最大数として機能します。ただし、プラットフォームはデータ取り込みのペースも制限しています。レートの制限を超えた場合、Splunk Observability Cloudは、送信されて来るデータをスロットリング(減速)する可能性があります。
名前に limit
または limited
が含まれる組織のメトリクスは、量の上限に達していることを示しますが、throttled
が含まれるメトリクス(たとえば、sf.org.numThrottledMetricTimeSeriesCreateCalls
)は、レート/時間の上限に達していることを示し、したがって、1分あたりのデータポイント数を超えて送信することができなくなります。
詳細は、製品別のシステム制限 を参照してください
トークン別の値のメトリクス 🔗
Infrastructure Monitoringが2つの類似したメトリクスを持つ場合があります:
1つのメトリクスは、
sf.org.numAddDatapointCalls
のように、組織全体の合計を表します。これに類似したメトリクス、
sf.org.numAddDatapointCallsByToken
は、使用される一意のアクセストークンごとの合計を表します。
測定において、すべてのトークン別メトリクス値の合計が、合計値メトリクスの値より小さくなる場合があります。たとえば、すべての sf.org.numAddDatapointCallsByToken
値の合計が、sf.org.numAddDatapointCalls
の値より小さくなる場合があります。この合計に差が生じるのは、Infrastructure Monitoringが、統合されたクラウドサービスからのデータの取得にトークンを使用しないためです。Infrastructure Monitoringは、統合されたサービスのデータポイントのコール数をカウントしますが、特定のトークンのコール数をカウントする方法は持っていません。
AWS CloudWatch、GCP StackDriver、AppDynamicsについて、この値の差が発生します。
各メトリクスタイプに対して値を持つメトリクス 🔗
一部のメトリクスは、メトリクスのタイプ(カウンター、累積カウンター、ゲージ)ごとに値を持つため、メトリクスごとに3つのMTSがあります。各MTSには、COUNTER
、CUMULATIVE_COUNTER
、または GAUGE
の値を持つ category
というディメンションがあります。これらのメトリクスは複数のMTSを持つ可能性があるため、sum()
のSignalFlow関数を使用して合計値を確認する必要があります。
例えば、sf.org.numMetricTimeSeriesCreated
について3つのMTSを受け取る可能性があります。カウンターであるMTSの数に対して1つ、累積カウンターであるMTSの数に対して1つ、ゲージであるMTSの数に対して1つです。
また、category
を単一の値でフィルタリングして(例: GAUGE
)、そのタイプのメトリクスだけを表示することもできます。
停止したディテクターをカウントするメトリクス 🔗
sf.org.numDetectorsAborted
のメトリクスは、ディテクターがリソース制限に達したためにInfrastructure Monitoringが停止させたディテクターの数を監視します。大部分は、ディテクターが250K MTSの制限を超えた場合です。この条件はまた、ディテクターID、停止の理由、およびMTSまたはデータポイントの値または制限(ディテクターが停止した原因となったいずれか)の詳細を記録するイベント sf.org.abortedDetectors
も生成します。
詳細については、イベントを使用してメトリクスにコンテキストを追加する を参照してください。
クラウド認証エラーのメトリクス 🔗
ロールを編集してクラウドサービスに対するユーザーの権限を削除すると、クラウドサービスプロバイダーからの認証エラーが発生する場合があります。この場合、Splunk Observability Cloudのインテグレーションは正しく動作せず、ご利用のサービスからデータとメタデータを収集できません。
Splunk Observability Cloudには、認証エラーを追跡するための以下のメトリクスがあります:
sf.org.num.awsServiceAuthErrorCount
sf.org.num.gcpServiceAuthErrorCount
sf.org.num.azureServiceAuthErrorCount
これらのエラーが発生した場合は、Splunk Observability Cloudがデータを取得できるようにするため、ロールまたはトークンを修正する必要があります。
ダッシュボード で、これらのエラーを使用して、この問題が発生しているかどうかを検出することができます。
子組織のメトリクス 🔗
親組織に関連する子組織がある場合、子組織のメトリクスもSplunk Observability Cloudに追加されます。これらは、同等の親組織のメトリクスと同じ値を表し、child
プレフィックスで識別することができます。
例えば、sf.org.child.numCustomMetrics
は、Splunk Observability Cloudがこの子組織について監視しているカスタムメトリクスの数を表します。これは、sf.org.numCustomMetrics
が親組織について監視されているカスタムメトリクスの数を表すのと同様です。
組織のメトリクスのリスト 🔗
メトリクスファインダー を使用して、組織のメトリクスを検索します。
Splunk Observability Cloudは、以下の組織メトリクスを提供しています:
トラブルシューティング 🔗
Splunk Observability Cloudをご利用のお客様で、Splunk Observability Cloud内のデータを確認できない場合は、以下の方法でサポートを受けることができます。
Splunk Observability Cloudをご利用のお客様
Splunk サポートポータル でケースを送信する
Splunkサポート に連絡する
見込み客および無料トライアルユーザー様
Splunk Answers のコミュニティサポートで質問し、回答を得る
Splunk #observability ユーザーグループの Slack チャンネルに参加して、世界中の顧客、パートナー、Splunk 社員とのコミュニケーションを図る。参加するには、Get Started with Splunk Community マニュアルの チャットグループ を参照してください。