Docs » Splunk APMでサービス、スパン、トレースを管理する » Use the service view for a complete view of your service health

Use the service view for a complete view of your service health 🔗

As a service owners you can use the service view in Splunk APM to get a complete view of your service health in a single pane of glass. The service view includes a service-level indicator (SLI) for availability, dependencies, request, error, and duration (RED) metrics, runtime metrics, infrastructure metrics, Tag Spotlight, endpoints, and logs for a selected service. You can also quickly navigate to code profiling and memory profiling for your service from the service view.

サービスビューは、インストルメント済みのサービス、pub/subキュー、 データベース、推定サービスについて利用可能です。様々なサービスタイプで利用可能な情報の詳細については、サービスビューによる様々なサービスタイプのサポート を参照してください。

Access the service view for your service 🔗

特定のサービスのサービスビューには、いくつかの場所からアクセスできます。

サービスの検索は、上部ツールバーの検索を使用して実行できます。

checkoutserviceを検索しサービスの検索結果を選択するユーザーの様子を示したアニメーション。

サービスマップ内で特定のサービスのサービスビューにアクセスすることもできます。最初にAPMのランディングページで Service Map を選択します。サービスマップ内でサービスを選択し、パネルで Service view を選択します。

サービスマップ内でサービスを選択したときのサービスビューボタンのスクリーンショット

最後に、APMのランディングページからサービスを選択することで、特定のサービスのサービスビューにアクセスすることもできます。

Use the service overview to monitor the health of your service 🔗

サービスビューを開くと、最近閲覧した環境に基づいて環境が選択されます。必要に応じて、環境と時間範囲のフィルターを調整してください。以下のセクションを使用して、サービスの健全性を監視してください。

Service metrics 🔗

Use the following metrics in the Service metrics section to monitor the health of your service. Collapse sub-sections that are not relevant to you to customize your service view.

This animation shows the service metrics for a service in the service view. The user select a chart to view example traces.
  • 成功率SLI - 成功率のサービスレベル指標(SLI)は、過去30日間でサービスに対するリクエストが成功した時間の割合を示します。このチャートには、成功したリクエストと失敗したリクエストが表示されます。成功率のサービスレベル目標(SLO)を設定している場合は、追加のチャートに、目標で指定したコンプライアンスウィンドウの期間における成功率が表示されます。サービスレベル目標(SLO)を用いて、サービスの健全性メトリクスを測定および追跡します。 を参照してください。

  • サービスマップ - サービスマップには、表示中のサービスの直接の上流および下流の依存関係が表示されます。サービスビュー内のサービスマップでは、リクエスト数が多い順の20サービスまでに表示が制限されています。チャートにカーソルを合わせ、View full service map を選択すると、サービスマップに移動します。

  • Service requests - The service requests chart shows streaming request data for the service. If you have detectors for the service requests configured, triggered alerts display below the chart. Select the chart to view example traces. Select the alert icon to view alert details.

  • Service latency - The service latency chart shows p50, p90, and p99 latency data for the service. If you have detectors for the service latency configured, triggered alerts display below the chart. Select the chart to view example traces. Select the alert icon to view alert details.

  • Service error - The service error chart shows streaming error data for the service. If you have detectors for the service error rate configured, triggered alerts display below the chart. Select the chart to view example traces. Select the alert icon to view alert details.

  • Dependency latency by type - The dependency latency by type chart shows the latency for each of the downstream systems. Select the chart to see details about each system category. Systems are categorized as follows:
    • Services - instrumented services

    • データベース

    • Inferred services - un-instrumented third-party services

    • Pub/sub queues - Publisher/subscriber queues

Runtime metrics 🔗

Instrument your back-end applications to send spans to Splunk APM to view runtime metrics. See バックエンドアプリケーションをインストルメンテーションして、スパンを Splunk APM に送信する.

利用可能なランタイムメトリクスは使用言語によって異なります。詳細は、Metric reference を参照してください。

Infrastructure metrics 🔗

Splunk Distribution of the OpenTelemetry CollectorとSignalFx Exporterを使用している場合、閲覧中の環境およびサービスのインフラストラクチャメトリクスが表示されます。Splunk Distribution of the OpenTelemetry Collector の利用開始 および SignalFx エクスポーター を参照してください。

以下のインフラストラクチャ メトリクスが利用できます:

  • ホストのCPU使用率

  • ホストのメモリ使用量

  • ホストのディスク使用量

  • ホストのネットワーク使用量

  • ポッドのCPU使用率

  • Pod memory usage

  • ポッドのディスク使用量

  • Pod network utilization

View Tag Spotlight view for your service 🔗

Select Tag Spotlight to view Tag Spotlight view filtered for your service. See Tag Spotlightを使用してサービスパフォーマンスを分析する to learn more about Tag Spotlight.

View endpoints for your service 🔗

Select the Endpoints tab to view endpoints for the service. Use the search field to search for specific endpoints. Use the sort drop-down list to change how endpoints are sorted. Select an endpoint to view endpoint details or go to Tag Spotlight, traces, code profiling, or the dashboard for the endpoint.

View logs for your service 🔗

Logs を選択すると、閲覧中の環境およびサービスのログが表示されます。デフォルトでは、最初にリストされているLog Observer Connect接続に対応するすべてのインデックスに関するログが表示されます。ログは、 service.name の値を使用して、表示中のサービスでフィルタリングされます。ログに service.name の値がない場合は、Splunk Webでエイリアスを作成できます。Splunk Web でフィールドエイリアスを作成する を参照してください。

別の接続を選択したり、ログの取得元のインデックスを絞り込んだりする場合は、Configure service view を選択します。

  1. Log Observer Connect Index ドロップダウンリストで、Log Observer Connectの接続を選択し、ログの取得元とするインデックスを選択します。

  2. Select Apply

  3. Select Save changes.

The connection and indices you select are saved for all users in your organization for each unique service and environment combination.

View traces for your service 🔗

表示中の環境とサービスのトレースを表示するには、Traces を選択します。Traces タブには、Service requests and errorsService latency のチャートが含まれます。チャート内で選択すると、トレース例が表示されます。

チャートの下には、Traces with errorsLong traces のリストがあります。トレースIDのリンクを選択すると、トレースウォーターフォールビューが開きます。その他のトレースを検索するには、View more in Trace Analyzer を選択します。Trace Analyzerを使用したトレース検索の詳細については、Splunk APMのTrace Analyzerを使用してトレースを調査する を参照してください。

データベースのトップコマンドやトップクエリを表示する 🔗

サービスのドロップダウンメニューからRedisまたはSQLデータベースを選択した場合、Database Query Performance を選択すると、データベースのトップコマンドまたはトップクエリを表示できます。詳細は Database Query Performanceの監視 を参照してください。

Go to the code profiling view for your service 🔗

Select Code profiling to go to the code profiling view of AlwaysOn Profiling filtered for your service. See Splunk APMのAlwaysOn Profilingの概要 to learn more about AlwaysOn Profiling.

Go to the memory profiling view for your service 🔗

Select Memory profiling to go to the memory profiling view of AlwaysOn Profiling filtered for your service. See Splunk APMのAlwaysOn Profilingの概要 to learn more about AlwaysOn Profiling.

サービスビューの設定 🔗

Select Configure service view to modify the Log Observer Connect connection and indices for the logs you want to display for your service.

  1. Log Observer Connect Index ドロップダウンリストで、Log Observer Connectの接続を選択し、ログの取得元とするインデックスを選択します。

  2. Select Apply

  3. Select Save changes.

The connection and indices you select are saved for all users in your organization for each unique service and environment combination.

サービスビューによる様々なサービスタイプのサポート 🔗

サービスビューで利用できる情報は、選択したサービスタイプによって異なります。次の表は、各サービスタイプで利用可能なセクションを示しています。

Service view section

Instrumented services

Databases

Pub/sub queues

Inferred services

概要

サポートあり。サービスメトリクス、ランタイムメトリクス、インフラストラクチャメトリクスを含みます

サポートあり。サービスメトリクスのみを含みます

サポートあり。サービスメトリクスのみを含みます

サポートあり。サービスメトリクスのみを含みます

Tag Spotlight

あり

あり

あり

あり

Endpoints

あり

なし

なし

あり

ログ

あり

あり

あり

あり

Traces

あり

あり

あり

あり

Database Query Performance

なし

サポートあり。RedisとSQLデータベースについてのみ表示されます。

なし

なし

Code profiling

あり

なし

なし

なし

Memory profiling

あり

なし

なし

なし

Metric reference 🔗

The following metrics are used in the service view.

Service metrics 🔗

Chart

メトリクス

Service requests

service.request with a count function

Service latency

  • service.request with a median function

  • service.requestpercentile 関数とパーセンタイル値 90 を使用)

  • service.requestpercentile 関数とパーセンタイル値 99 を使用)

Service errors

service.requestscount 関数と sf_error:True フィルターを使用)

SLI/SLO

service.request with a count function

.NET runtime metrics 🔗

Chart

メトリクス

Heap usage

process.runtime.dotnet.gc.committed_memory.size

GCコレクション

process.runtime.dotnet.gc.collections.count

Application activity

process.runtime.dotnet.gc.allocations.size

GCヒープサイズ

process.runtime.dotnet.gc.heap.size

GC一時停止時間

process.runtime.dotnet.gc.pause.time

モニターのロック競合

process.runtime.dotnet.monitor.lock_contention.count

Threadpool thread

process.runtime.dotnet.monitor.lock_contention.count

Exceptions

process.runtime.dotnet.exceptions.count

Java runtime metrics 🔗

Charts

メトリクス

メモリ使用量

  • runtime.jvm.gc.live.data.size

  • runtime.jvm.memory.max

  • runtime.jvm.memory.used

割当率

process.runtime.jvm.memory.allocated

Class loading

  • runtime.jvm.classes.loaded

  • runtime.jvm.classes.unloaded

GCアクティビティ

  • runtime.jvm.gc.pause.totalTime

  • runtime.jvm.gc.pause.count

GC overhead

runtime.jvm.gc.overhead

Thread count

  • runtime.jvm.threads.live

  • runtime.jvm.threads.peak

Thread pools

  • executor.threads.active

  • executor.threads.idle

  • executor.threads.max

Node.js runtime metrics 🔗

Charts

メトリクス

Heap usage

  • process.runtime.nodejs.memory.heap.total

  • process.runtime.nodejs.memory.heap.used

常駐セットサイズ

process.runtime.nodejs.memory.rss

GCアクティビティ

  • process.runtime.nodejs.memory.gc.size

  • process.runtime.nodejs.memory.gc.pause

  • process.runtime.nodejs.memory.gc.count

イベントループラグ

  • Process.runtime.nodejs.event_loop.lag.max

  • process.runtime.nodejs.event_loop.lag.min

Infrastructure metrics 🔗

Chart

メトリクス

ホストのCPU使用率

cpu.utilization

ホストのメモリ使用量

memory.utilization

ホストのディスク使用量

disk.summary_utilization

ホストのネットワーク使用量

network.total

ポッドのCPU使用率

  • container_cpu_utilization

  • cpu.num_processors

  • machine_cpu_cores

  • k8s.container.ready

Pod memory usage

  • k8s.container.ready

  • container_memory_usage_bytes

  • container_spec_memory_limit_bytes

ポッドのディスク使用量

  • k8s.container.ready

  • container_fs_usage_bytes

Pod network utilization

  • k8s.container.ready

  • pod_network_receive_bytes_total

  • pod_network_transmit_bytes_total

このページは 2024年08月06日 に最終更新されました。