利用開始ガイド フェーズ3:ロールアウトの拡張 🔗
利用開始ガイド フェーズ2:初期ロールアウト を完了したら、フェーズ3の「ロールアウトの拡張」に進むことができます。最終フェーズであるロールアウトの拡張フェーズでは、自動化、データ管理、ディテクター、ダッシュボードを使用して、反復可能なオブザーバビリティの実践を確立します。以下のセクションでは、ロールアウトの拡張フェーズにおける主なセットアップ手順を説明します。
Splunk Observability Cloudの利用開始過程全体の大まかな概要を把握するには、Get started guide for Splunk Observability Cloud admins を参照してください。
注釈
This guide is for Splunk Observability Cloud users with the admin role.
ユーザーチーム全体での利用を増やし、自動化、データ管理、ディテクター、ダッシュボードを使用して反復可能なオブザーバビリティ実践を確立するには、以下のタスクを完了します:
注釈
利用開始にあたっては、Splunkセールスエンジニアまたは Splunkカスタマーサクセスマネージャーと密接に連携してください。お客様のSplunk Observability Cloudの旅の微調整をお手伝いし、ベストプラクティス、トレーニング、ワークショップアドバイスを提供します。
Add Splunk Observability Cloud to your deployment pipeline 🔗
初期ロールアウトフェーズを完了すると、限られた構成でCollectorインスタンスがデプロイされています。ロールアウトを拡張するには、Collectorパイプラインをより多くのコンポーネントやサービスで拡大します。
See はじめに:Collectorを理解して使用する for an overview of the available options to install, configure, and use the Splunk Distribution of the OpenTelemetry Collector.
Collectorパイプラインでデータがどのように処理されるかについては、パイプラインでデータを処理する を参照してください。
Collector設定に追加できる利用可能なコンポーネントについては、Collector コンポーネント のドキュメントを参照してください。
You can also use other ingestion methods, like the following:
To send data using the Splunk Observability Cloud REST APIs, see Splunk Observability Cloud REST API を使用してメトリクス、トレース、イベントを送信する.
クライアントライブラリを使用したメトリクス送信については、SignalFlowクライアントライブラリ を参照してください。
For information about using the upstream Collector, see OpenTelemetry Collector Contribプロジェクトを使用してテレメトリを送信します。.
Automate the token rotation process 🔗
トークンの有効期限は1年であるため、APIコールを使ってトークンのローテーションを自動化する必要があります。所定のトークンについて、APIが新しいトークンを作成すると、古いトークンは、猶予期間で指定した時間まで機能し続けます。古いトークンが使用されている場合は、APIコールを使用して猶予期間内にトークンを自動でローテーションします。
例えば、APIを使用して、Kubernetesクラスターがメトリクスとトレースデータの取り込みに使用するトークンをローテーションすることができます。APIを使用して新しいトークンを生成すると、自動化の一部としてKubernetesクラスター内のシークレットに新しいトークンを直接保存できます。
To learn more, see the following topics:
メトリクスパイプライン管理ツールを使用して、メトリック時系列(MTS)のカーディナリティを削減する 🔗
Splunk Infrastructure Monitoringでメトリクスデータの使用量とカーディナリティが増加すると、コストが増加します。Splunk Infrastructure Monitoring内のメトリクスパイプライン管理(MPM)ツールを使用してストレージと処理を効率化し、全体的な監視コストを削減します。MPMを使用すると、次のような最適化を行うことができます:
ストレージと処理を合理化し、多層のメトリクス分析プラットフォームを作成する。
レポートを分析し、使用量を最適化すべき場所を特定する。
ルールベースのメトリクス集計とディメンションのフィルタリングを使用して、MTSの量を削減する。
不要なディメンションを除外する。
ディメンションは、ユーザーインターフェイス、API、Terraformで設定できます。
MPMに関するより包括的なドキュメントは、メトリクス パイプライン管理の概要 を参照してください。
メトリクス名と取り込まれたデータを確認する 🔗
デプロイメントの拡張を成功させるためには、Splunk Observability Cloudのトークンとカスタムメトリクスの命名規則について検討してください。メトリクスに一貫性のある階層的な命名規則を使用すると、メトリクスの検索、使用状況の特定、さまざまなホストやノードを対象としたチャートやアラートの作成が容易になります。
組織の命名規則の作成に関するガイダンスは、メトリクスとディメンションの命名規則 を参照してください。
メトリクスデータを取り込んだら、各チームが取り込んでいるメトリクスの名前と量を確認します。取り込むデータが、ディメンションとプロパティの命名規則と一致していることを確認してください。
Build custom dashboards and detectors 🔗
ダッシュボードは、メトリクスを視覚化するチャートのグループです。ダッシュボードを使用すると、チームは、一目でシステムに対する実用的なインサイトを取得できます。ディテクターを使用すると、指定した特定の条件に対してストリーミングデータを監視し、特定の条件が満たされたときにユーザーに通知することができます。
Build custom dashboards 🔗
Splunk Observability Cloudは、データポイントを50,000取り込むと、使用する各インテグレーションに対して内蔵ダッシュボードを自動的に追加します。これらの内蔵ダッシュボードが利用可能になったら、確認してください。Splunk Observability Cloudでダッシュボードを表示する および 利用可能なダッシュボード を参照してください。
- ダッシュボードの作成とカスタマイズの方法を学習します。チームが以下のタスクを完了できるようにしてください:
Clone, share, and mirror dashboards.
ダッシュボードフィルターとダッシュボード変数の使用
ダッシュボードへのテキストメモおよびイベントフィードの追加
データリンクを使用した、ダッシュボードから別のダッシュボードや外部システム(Splunk APM、Splunkプラットフォーム、カスタムURL等 )への動的リンク
For comprehensive documentation on these tasks, see Splunk Observability Cloudのダッシュボード.
カスタムディテクターの構築 🔗
またSplunk Observability Cloudは、使用しているインテグレーションに対応するAutoDetectディテクターを自動的に追加します。AutoDetectディテクターはコピーしてカスタマイズすることができます。AutoDetectアラートおよびディテクターの使用とカスタマイズ を参照してください。
カスタムディテクターを作成し、ユースケースに対処するためのアラートをトリガーします。Splunk Observability Cloudのアラートとディテクターの概要 を参照してください。
- 高度なディテクターを作成して、追加的な発動、アラートの解除条件、または、population_comparison関数を使用した2つの関数の比較といった、さまざまな種類の関数を考慮に入れてアラート条件の基本リストを強化します。
GitHubで ディテクターのSignalFlowライブラリ を参照してください。
SignalFlowの利用を開始するには、開発者ガイドの「 SignalFlowを使用したデータ分析 」を参照してください。
すべてのユーザーとチームをオンボードする 🔗
ロールアウトの拡張フェーズの最後の手順は、すべてのユーザーとチームをオンボードし、Splunk Observability Cloudのさまざまな側面について、表示と変更ができるユーザーを設定することです。
ユーザー、チーム、およびロールの管理を開始するには、ユーザーとチームを管理する を参照してください。
まだ行っていない場合はセキュリティの強化を有効にして、チームマネージャーを特定し、ダッシュボードとディテクターを表示および変更できるユーザーを制御します。チームセキュリティの強化を有効にする を参照してください。
設定したディテクターによってトリガーされるアラートに対して、チーム固有の通知を割り当てます。チーム固有の通知を使用すると、アラートに対するさまざまなエスカレーション方法をチームで利用できます。Splunk Observability Cloudでチームの通知を管理する を参照してください。
オプションの設定と高度な設定 🔗
以下に説明するオプションの設定や高度な設定を検討して、組織に適したセットアップのカスタマイズを行ってください。
グローバルデータリンクを使用して、プロパティを関連リソースにリンクさせる 🔗
グローバルデータリンクを作成して、Splunk Observability Cloudのダッシュボードを他のダッシュボード、外部システム、カスタムURL、またはSplunk Cloud Platformのログにリンクさせます。詳細は、グローバル・データリンクを使用して、メタデータを関連リソースにリンクする を参照してください。
使用量、制限、スロットルの分析とトラブルシューティング 🔗
使用状況の分析とトラブルシューティングを行うには、以下のタスクの実行方法を必ず理解してください:
Infrastructure MonitoringにおけるホストベースのサブスクリプションとMTSベースのサブスクリプションの違いを理解する
APMにおけるホストベースのサブスクリプションとTAPM(trace-analyzed-per-minute)サブスクリプションの違いを理解する
製品ごとのシステム制限を理解する
月次および時間単位の使用状況レポート、ディメンションレポート、カスタムメトリクスレポートなどの利用可能なレポートを読む
To learn more, see the following topics:
Education resources 🔗
OpenTelemetryエージェントの使用のスケールアップを開始する前に、OpenTelemetryのサイジングガイドラインを検討してください。これは、さまざまな自動スケーリングサービスからの急激な増加の可能性があるKubernetesのようなプラットフォーム上では特に重要です。サイジングガイドラインの詳細については、サイジングとスケーリング を参照してください。
Splunk Observability Cloudワークショップへのお申し込みは、Splunkセールスエンジニアにご相談ください。Splunk Observability Cloudワークショップ を参照してください。
Splunk Observability Cloudエンドユーザー向けのトレーニングカリキュラムの作成を開始するには、エンドユーザー向けトレーニングの要約情報 を参照してください。