モニターホスト 🔗
Splunk Observability Cloud でホストのメトリクスを監視できます。ホストの監視を開始する前に、管理者認証情報でサインインし、ホストからメトリクスをエクスポートする必要があります。以下のリソースでは、サポートされているホストタイプからメトリクスをエクスポートする方法を説明しています:
Splunk Observability Cloudは、Splunk Distribution of OpenTelemetry Collector を利用するインフラストラクチャ監視機能を提供します。
以下の表で説明されているように、ホストに関するデータをエクスポートして監視することもできます。
でデータを取得する |
を監視する |
説明 |
---|---|---|
ホストが稼働しているクラウドサービスプロバイダーに接続します (ある場合)。 |
||
ホスト上で実行されているアプリケーションからメトリクスとスパンを収集します。 |
Splunk Observability Cloud は、以下のホストとアプリケーションのモニター に対しても、メトリクスとその他のデータを提供します。
インフラストラクチャページからホストを監視する 🔗
インフラストラクチャのページから、データセンター全体の健全性を一目で確認できます。このページでは、各ホストに関する主要なパフォーマンス情報を一目で確認できます。
注釈
My Data Center のホストインスタンスには、Splunk Distribution of OpenTelemetry Collectorがインストールされているホストのみが含まれます。SmartAgent がインストールされているすべてのホスト (パブリッククラウドかどうかにかかわらず) のパフォーマンスを確認するには、Navigation menu > Dashboard > Built-in を選択し、Hosts with agent installed インデックスを選択します。
また、My Data Centerのホストインスタンスには、Amazon EC2、GCP Compute Engine、Azure Virtual Machines、Kubernetesインスタンスは含まれません。Amazon EC2、GCP Compute Engine、Azure Virtual Machines、Kubernetesインスタンスを表示するには、Splunk Infrastructure Monitoring でナビゲーターを使用する を参照し、各サービスのナビゲーターにアクセスしてください。
以下の手順に従って、Infrastructureページから問題のあるホストを解析してください:
ナビゲーションメニュー > インフラストラクチャ を選択し、ホスト カテゴリを選択します。
Color by ドロップダウンリストを使用して、以下のメトリクスに沿ってホストを比較します。ヒートマップでは、選択したメトリクスに基づいて、インスタンスの健全性を色で表します。例えば、緑と赤を表示するヒートマップでは、緑が健全なインスタンス、赤が不健全なインスタンスを表します。ヒートマップに複数の色がある場合、グラデーションが薄いほどアクティビティが少なく、濃いほどアクティビティが多いことを表します。カスタムダッシュボードとチャート、および Infrastructure Monitoring 全体に視覚的に利用しやすいカラーパレットを適用するには、アカウント設定 > カラーアクセシビリティ を選択します。
メトリクス
説明
cpu.utilization
CPU使用率が20%未満のホストは緑色、CPU使用率が80%以上のホストは赤で表示されます。
memory.utilization
メモリ使用率が20%未満のホストは緑色、メモリ使用率が80%以上のホストは赤で表示されます。
disk.summary_utilization
ディスク使用率が20%未満のホストは緑色、ディスク使用率が80%以上のホストは赤で表示されます。
network.total
ネットワークトラフィックが最も少ない20%のホストが緑色、最も多い20%のホストが赤色の相対比較。
disk_ops.total
ディスク操作の20%が最も少ないホストが緑色、20%が最も多いホストが赤色の相対比較。
Group by ドロップダウンリストを使用して、各ホストに関するメタデータに基づいてホストをグループ化します。
例えば、実行中のリージョン、オペレーティングシステムのバージョン、または環境タグに従って、ホストをグループ化して見ることができます。これを使用して、インフラストラクチャのさまざまな部分とパフォーマンスの相関関係を確認します。
外れ値を見つける 設定を使用して、メトリクスの外れ値を検索します。範囲 と 戦略 を指定します。
範囲 を設定して、インスタンスの可視集団全体から外れ値を分析するか、またはインスタンスをグループ化したディメンションまたはプロパティによって定義されたグループ内のみから外れ値を分析します。
次の表で説明されているように、外れ値を見つけるために、2つの 戦略 のうちの1つを選択することができます。
戦略
説明
Deviation from Mean
メトリクスの平均値から少なくとも3標準偏差を超えたホストは赤で表示されます。この設定を使用して、最も極端な外れ値を見つけます。
Deviation from Median
絶対偏差の中央値を少なくとも3つの絶対偏差で超えたホストは赤で表示されます。この設定では、極端な外れ値は標準偏差ほど重視されません。
さらに調査したい特定のホストを選択すると、そのホストのすべてのメタデータと主要メトリクスが表示されます。すべてのホストインスタンスについて、Splunk Observability Cloudは、ホストインスタンスにドリルダウンするためのビルトインコンテンツを提供します。
ホストインスタンスにドリルダウンして調査またはトラブルシューティングする方法についてのインタラクティブなウォークスルーについては、Splunk Infrastructure Monitoring Web サーバー トラブルシューティングシナリオ および Splunk Infrastructure Monitoring アプリケーション モニタリングシナリオ を参照してください。
使用可能なビルトインコンテンツについては、以下のセクションを参照してください。
ダッシュボードでメタデータを確認する 🔗
ホスト インスタンスが実行されているクラウド サービス、ホスト自体、およびホストに関連付けられたカスタム タグに関するすべての利用可能なメタデータを分析するには、Infrastructure Monitoring が提供するダッシュボードを使用できます。デフォルトのダッシュボードには、以下のメトリック時系列(MTS)を表すさまざまなチャートが用意されています:
CPU使用率
メモリ使用率
ディスク使用率
ディスク操作
ネットワークI/O
詳しくは、内蔵ダッシュボード を参照してください。
プロセスリストでプロセスを調査する 🔗
ホストインスタンスのドリルダウン表示では、ホスト上のプロセスの現在のステータスと完全なリストにアクセスして、CPU使用率、メモリ使用率などに基づいて潜在的な外れ値プロセスを探すことができます。
注釈
プロセスの完全なリストを表示するには、OpenTelemetry の設定に プロセスリスト モニタータイプ を入れてください。
デフォルトでは、プロセスのリストはCPU使用率の降順でソートされます。
リストを別のプロパティで並べ替えたり、並べ替え順序を切り替えたりするには、並べ替えたいプロパティを表す列のヘッダーをクリックします。プロセスリストの列は、ご使用の *nix システムで
top
コマンドを実行すると表示されるプロパティと同じです。COMMAND列のいくつかのコマンドは切り捨てられていますが、切り捨てられたテキストにカーソルを合わせると、コマンドの全文を確認することができます。また、Copy to Clipboard アイコンをクリックして、全文をコピーすることもできます。