Docs » Splunk Infrastructure Monitoring でナビゲーターを使用する

Splunk Infrastructure Monitoring でナビゲーターを使用する 🔗

Splunk Infrastructure Monitoring では、ナビゲーターはリソースのコレクションであり、サービスのさまざまなインスタンスにわたってメトリクスとログを監視し、主要なパフォーマンスナビゲーターに基づいてインスタンス集団の外れ値を検出することができます。ナビゲーター内のリソースには、エンティティの完全なリスト、ダッシュボード、関連するアラートとディテクター、サービスの依存関係が含まれますが、これらに限定されません。

すべてのナビゲーターを確認する 🔗

すべてのナビゲーターを表示するには、Splunk Observability Cloud ホームページから Infrastructure を選択します。

Infrastructure Monitoring のランディングページでは、各カードがナビゲーターを表し、Splunk Observability Cloud で監視するサービスに対応しています。ナビゲーターカードは、母集団内のインスタンス数を表示し、その母集団にリンクする重要なアラートをハイライトします。

ナビゲーター内のすべてのインスタンスを監視する 🔗

注釈

以下のセクションは、Network ExplorerとKubernetes ナビゲーターを除くほとんどのナビゲーターに適用されます。詳細については、ネットワークマップによるサービスの依存関係の監視 および Kubernetesを監視する を参照してください。

ほとんどのナビゲーターでは、インスタンスを監視するために、テーブルビューとヒートマップビューの2つのオプションがあります。

デフォルトでは、AWS、Azure、および一部のGCPナビゲーター(Google Compute Engine、Google Kubernetes Engine、Google Cloud Storage)では、データでリージョンプロパティが利用可能な場合、インスタンスはリージョンごとにグループ化されます。デフォルトのグループ化は、テーブルビューとヒートマップビューの両方に適用されます。

次の表は、各ビューでインスタンスがどのようにソートされているかを示しています:

インスタンス監視オプション

説明

テーブルビュー

ナビゲーターのデフォルトビュー。
インスタンスは、Color by ドロップダウンメニューから選択したメトリクスの相対値に基づいて降順にソートされます。
  • 並べ替えの順序を逆にしたり、利用可能な列見出しをクリックして別の並べ替え基準を選択したりすることができます。

  • テーブルビューから列を追加したり削除したりすることはできません。

ヒートマップ表示

それぞれの四角には、Color by ドロップダウンメニューから選択したメトリクスの相対値を表す色があります。

  • 色は低い値(明るい色)から高い値(暗い色)までです。

  • オプションで各色‑のデフォルトの色を変更することはできません。

  • ナビゲーターは、各色の値域を自動的に設定します。

注釈

テーブルビューで、Amazon EC2、GCP Compute Engine、Azure Virtual Machines ナビゲーターの Splunk Distribution of OpenTelemetry Collector を通してレポートするインスタンスのデータが欠落している列があるかもしれません。これは、Splunk Distribution of OpenTelemetry Collector と CloudWatch などのネイティブエージェント間のプロパティ名の違いによるものです。

フィルタリングやグループ化など、ナビゲーターのコンテンツやフォーマットのカスタマイズについては、ナビゲーター表示をカスタマイズする を参照してください。

Infrastructure Monitoring でナビゲーターを使用して Web サーバーのトラブルシューティングを行う方法、またはアプリケーションと基盤となるインフラストラクチャを観察する方法については、Splunk Infrastructure Monitoring Web サーバー トラブルシューティングシナリオ および:new-page:Splunk Infrastructure Monitoring アプリケーション モニタリングシナリオ<https://splunko11y.com/imt/application-monitoring.html> を参照してください。

利用可能なすべてのナビゲーターのリストについては、ナビゲーター利用可能 を参照してください。

注釈

AWS Lambdaのナビゲーターに表示される形式や内容は、後述する内容とは異なります。

ドリルダウン 🔗

ヒートマップビューでは、ナビゲーターで四角にカーソルを合わせると、四角で表されたインスタンスに関する情報が表示されます。四角をクリックすると、そのインスタンスにドリルダウンできます。

または、テーブルビューで、インスタンスのインスタンスIDをクリックして、そのインスタンスにドリルダウンすることもできます。

例えば、ホストインスタンスを表す四角をクリックすると、ビルトインダッシュボードでシステムメトリクス情報をチャート付きで見ることができます。また、[プロパティ]サイドバーで、ホストのさまざまなプロパティ、ホスト上で実行されているプロセスなどを確認できます。

注釈

要素の色や統計は、ドリルダウンしたり、システム内をクリックしたりすると変化することがあります。これは、ナビゲーションを開始してからターゲット要素が表示されるまでの間に、情報が更新される可能性があるためです。

1つのインスタンスにドリルダウンすると、パンくずトレイルを使用して別のインスタンスのドリルダウンビューに切り替えたり、ナビゲータービューに戻ったりできます。

ダッシュボードセクションを使用する 🔗

ダッシュボード セクションには、表示されているインスタンスの詳細情報にアクセスできるビルトインダッシュボードが含まれています。

ナビゲーターのダッシュボードは|hyph| の読み取り専用なので、直接変更を加えることはできません。ただし、組み込みダッシュボードをクローンしてそのクローンに変更を加えたり、組み込みダッシュボードをダウンロードすることはできます。管理者として、カスタムダッシュボードを追加または削除したり、使用しない組み込みダッシュボードを非表示にしたりすることもできます。

詳細については、内蔵ダッシュボード ドキュメントの ナビゲーターの内蔵ダッシュボードを複製する および ナビゲーターの内蔵ダッシュボードをエクスポートする を参照してください。

注釈

Amazon EC2、GCP Compute Engine、Azure Virtual Machinesインスタンスは、それぞれのパブリック クラウドサービスと Splunk Distribution of OpenTelemetry Collector によって動いています。ビルトインダッシュボードでデータを表示するには、すべてのチャートにこの両方が必要です。

  • パブリック クラウドサービスとスマートエージェントのみが構成されている場合、Amazon EC2、GCP Compute Engine、およびAzure Virtual Machinesインスタンスのビルトインダッシュボードの一部のチャートにはデータが表示されません。

  • パブリック クラウドサービスのみを構成している場合、データの送信元サービスを表すすべてのカードが表示されますが、Amazon EC2、GCP Compute Engine、Azure Virtual Machinesインスタンスのビルトインダッシュボードの一部のチャートにはデータが表示されません。

  • Smart Agentのみを設定している場合、Amazon EC2、GCP Compute Engine、Azure Virtual Machinesのインスタンスナビゲーターは利用できません。

ナビゲーター表示をカスタマイズする 🔗

各ナビゲーター内のコントロールバーで、どのインスタンスを表示するか、どのようにグループ化するか、どのメトリクスに注目するかなどを変更できます。

フィルターを追加する 🔗

Add Filter をクリックしてフィルターを作成し、指定したディメンションまたはプロパティに基づいて環境の特定のスライスを表示します。フィルタリングは、特定のサービスを実行しているインスタンスや、特定のアベイラビリティゾーン内のインスタンスのみを表示する場合に特に便利です。

ホストインスタンスに適用するフィルターは、ナビゲーターサイドバーの依存関係もフィルタリングします。ナビゲーターサイドバーの詳細については、同じトピックの ナビゲーターのサイドバーに依存関係を表示する を参照してください。

時間範囲をカスタマイズする 🔗

デフォルトでは、過去3時間のデータが表示されます。タイムピッカーを使用して、新しい時間範囲を選択できます。新しい時間範囲を選択すると、ナビゲーターが更新され、その時間帯のインスタンスのステータスが表示されます。

選択した時間範囲の終了日と開始日の間の時間が7日以上ある場合、ナビゲーターの応答に時間がかかることがあります。

Color by 🔗

コントロールバーの Color by ドロップダウンメニューを使用して、正方形の色に使用するメトリクスを指定します。正方形の色の値は、選択した Color‑by 基準によって異なります。

例えば、CPU Utilization を選択した場合、色は緑(全インスタンスの中で最も低い20%の値)から赤(全インスタンスの中で最も高い20%の値)の範囲になります。多くのメトリクススでは、赤は問題の状況ではなく、パフォーマンスの強さを示します。

  • 白い四角は、指定したメトリクスの値を出さないインスタンスを示します。

  • 黒い四角は、指定された期間値を発しないため、Infrastructure Monitoringによって「デッド」とみなされたインスタンスを示します。

    アクションメニュー(⋯)から Navigator Settings を選択することで、これらの非発光インスタンスに関連する設定を指定することができます。インスタンスが再び値を放出し始めると、それに応じて正方形が再色付けされます。

Group by 🔗

コントロールバーの Group by ドロップダウンメニューを使用して、選択したディメンションまたはプロパティでインスタンスを分割します。リストの異なるオプションにカーソルを合わせるか選択すると、ナビゲーターでインスタンスが即座に再配置されます。この機能により、最大2レベルの階層的なグループ化を行うことができます。

場合によっては、ドロップダウンメニューに「n/a」というタイトルのオプションが表示されることがあります。このグループには、指定する Group‑by ディメンションまたはプロパティの値を持たないインスタンスが含まれます。

Group|hyph| by フィールドを指定すると、グループ名を選択してナビゲーターをフィルタリングし、そのグループのインスタンスのみを表示することができます。パンくずリストが更新され、選択したグループが表示されます。

外れ値を見つける 🔗

外れ値検出を適用して、データ内のインスタンスの外れ値を識別します。外れ値は、Color by メトリクスの値に基づいて赤色で示されます。

外れ値の検出は、データ分析で一般的な2つの戦略のうちの1つによって決定することができます:

  • 母集団の平均からの偏差

    他のインスタンスの平均値よりかなり高い値を持つインスタンスを強調表示します。この戦略では、最も極端な値を持つインスタンスのみが強調表示される傾向があり、インスタンス数が多い(15以上)場合にのみ意味のある結果が得られます。

  • 母集団の中央値からの偏差

    他のインスタンスの中央値よりも有意に高い値を持つインスタンスを強調表示します。大多数のインスタンス間で値の差が比較的小さい場合、このストラテジーはこの大多数に属さないインスタンスをハイライトする傾向があります。

例えば、インスタンスが実行中のサービス別にグループ化され、cpu.utilization で色分けされ、外れ値検出が有効になっている場合、他のインスタンスよりもCPUの使用量が著しく多いインスタンスは赤で強調表示されます。そうすれば、特定のインスタンスを調査して、挙動が異なる理由を特定することができます。

どちらの外れ値戦略も、他とは異なる動作をしているインスタンスを強調しますが、母集団に2つの外れ値グループがある場合、例えば、ほとんどのインスタンスがCPU使用率20%で動作しているが、3つのインスタンスが60%で動作し、1つのインスタンスが80%で動作している場合、平均値からの偏差はより大きな外れ値(80%で動作しているインスタンス)を検出します。常に1つの戦略から別の戦略に切り替えて、特定の環境に最適なものを見つけることができます。

また、[外れ値を見つける] 機能には、(Group By ディメンションで定義された) 類似した特性を持つインスタンスのみに比較対象を限定できる母集団セレクタも用意されています。例えば、異なるソフトウェアを実行している他のサーバーと比較したくない場合があります。同じサービスを提供するサーバー間の外れ値を判断する方が適切です。インスタンスを実行するサービスによってグループ化し、それを母集団の基準として使用することで、インスタンスが同業他社とのみ比較され、異常な動作をするかどうかが判断されます。

ナビゲーターのサイドバーに依存関係を表示する 🔗

注釈

Kubernetes、ホスト、バーチャルホストでのみ利用可能です。

Kubernetes のナビゲーター、My Data Center のホスト、および Amazon EC2、Azure Virtual Machines、Google Cloud Platform の仮想ホストでは、ナビゲーターのサイドバーで依存するサービスとコンテナを追跡できます。

ベストプラクティス 🔗

ナビゲーターサイドバーを最大限に活用するには、Splunk Distribution of OpenTelemetry Collector 設定ファイルで追跡したいサービスを extraDimensions の下に service.name の値として設定します。 service.name 値を設定することで、特定のホストインスタンスで実行されている個々のサービスなど、データの詳細を確認できます。

🔗

例えば、redis-cart サービスは、この Splunk Distribution of OpenTelemetry Collector 設定に含まれています。

receiver_creator:
  receivers:
    smartagent/redis:
     rule: type == "pod" && name contains "redis"
     config:
       type: collectd/redis
       host: redis-cart
       port: 6379
       extraDimensions:
         service.name: redis-cart

Splunk Distribution of OpenTelemetry Collector の設定の詳細については、Collector コンポーネント を参照してください。

ナビゲーターを使ってアラートを表示する 🔗

サービスに有効なアラートがある場合、ナビゲーターを通じてサービスのアラート一覧を表示できます。

  1. Splunk Observability Cloud ホームページから Infrastructure を選択します。

  2. 表示するナビゲーターを検索してください。

  3. ナビゲーターのタイトルの下で、アラートの数を表示するテキストを選択します。アラートの数とタイプはナビゲーターによって異なります。

For the following example navigator, the user selected 90 Critical alerts.

この画像は、90の重要警告がアクティブになっているナビゲーターを示しています。

このテキストを選択すると、ナビゲーターの詳細ビューが開き、サイドバーにアクティブなアラートのリストが表示されます。

View navigators using alerts 🔗

When you’re investigating an alert, you can refer at a glance to Infrastructure in the Next Steps section of the modal window displaying that alert. The section displays a link to the relevant Infrastructure Monitoring navigator. Select that link to open the navigator without losing contextual metadata from the alert. Applicable metadata passes automatically from the alert to the navigator.

An alert with a clickable link to an EC2 navigator

Variable data passed from alerts to navigators includes the time that the alert occurred as well as relevant metrics and properties from the alert.

By linking alerts in real time with the navigators that triggered them, the 「alert to navigator」 experience makes troubleshooting faster.

非アクティブなナビゲーターを削除する 🔗

注釈

ナビゲーターを削除するには管理者である必要があります。

When data for an integration hasn’t been received for 72 hours, the navigator for that integration becomes inactive, and you have the option remove it from view. The navigator automatically reappears if data for the integration is received again.

Follow these steps to remove an inactive navigator:

  1. Splunk Observability Cloud ホームページから Infrastructure を選択します。ナビゲーターを削除できるのは、Infrastructure Monitoring ランディングページビューにいるときだけです。

  2. 非アクティブなナビゲーターで、Remove Navigator を選択します。

  3. 選択を確認します。

利用可能なナビゲーターをリストする 🔗

利用可能なすべてのナビゲーターのリストについては、ナビゲーター利用可能 を参照してください。

ナビゲーターをカスタマイズする 🔗

ナビゲーターに関連する内蔵ダッシュボードのグループに追加したり、グループから削除したりして、ナビゲーターをカスタマイズする方法については、Splunk Infrastructure Monitoring ナビゲーターでダッシュボードをカスタマイズする を参照してください。

This page was last updated on 2024年05月28日.