管理者クイックスタートガイド 🔗
セットアップ 🔗
ユーザーを追加する 🔗
Splunk On-Callのセットアップで最も重要な最初のステップは、ユーザーの追加です。新しいユーザーを追加するには、主に2つの方法があります:ポータルでメールアドレスを利用します( :guilabel:`Users` を選択し、次に :guilabel:`Invite User` を選択します)。 APIを利用する(IDとキーが必要です。Integrations、API の順に選択して、見つけることができます)
チームの作成 🔗
チームは以下で構成されます:
ユーザーリスト
オンコールシフト
エスカレーションポリシー
チームを作成するには、上部のナビバーから「チーム」セクションに移動します。「チーム」ページから、Add Team を選択し、名前を選択します。
チーム間で明確に区別するために、チーム名を標準化することをお勧めします。サービスや社内チーム名など、組織にとって意味のあるチーム名を選んでください。
ユーザーの招待と管理者の宣言 🔗
チームをいくつか作ったら、次は人を追加します。招待ユーザーを追加できます。次に、ユーザーのロールに基づいてユーザーの階層を設定します:例えば、管理者、ユーザー、チーム管理者などです。
ローテーションを作成する 🔗
ローテーションは、定期的なオンコール・スケジュールです。基本的にはオンコールシフトのグループです。1つのシフトを多数の人で共有します。
注:ローテーションが予定されていても、自動的にオンコールになるわけではありません。
エスカレーションポリシーを作成する 🔗
エスカレーションポリシーは、どのインシデントを誰にルーティングし、どのようにエスカレーションするかを決定します。基本的に、エスカレーションポリシーとは、Splunk On-Callがトリガーされたイベントをどのようにエスカレーションするかということです。
エスカレーションポリシーを設定する際のベストプラクティスは、最低3つのエスカレーションパスを設定することです:勤務中のユーザー、ローテーションの前/次のユーザー、マネージャー/チームリーダーです。1つのチーム内で複数のアラート動作を管理する方法に関するヒントやコツについては、この投稿のリンクをお読みください。
ルーティングキーを設定する 🔗
ルーティングキーは、モニタリングツールからのアラートをSplunk On-Callの特定のチーム(またはエスカレーションポリシー)に結びつけます。これにより、適切な担当者が問題に対処できるようになり、特定のインシデントに無関係なアラートのノイズを減らすことができます。ルーティングキーは「設定」>「ルーティングキー」で確認できます。
アラートを処理するチームまたはポリシー、アラートのサービスまたはホスト、アラートの発信元を監視するツールの名前を使用します。ルーティングキーは大文字と小文字を区別しませんが、アラートがデフォルトのルーティングチームに送られるのを防ぐため、すべて小文字を使用することをお勧めします。
マッチングチーム名:CloudOps(チーム)=cloudops(ルーティングキー)
マッチング監視ツールSplunk (ツール) = splunk (ルーティングキー)
インテグレーション 🔗
最後に、カスタムインテグレーションを設定します。インテグレーションは、Splunk On-Callにアラートをフィードしてインシデントを作成し、ページアウトします。インテグレーションの全リストと設定方法の詳細については、こちらをご覧ください。お探しのものが見つからない場合は、一般的なメールまたはRESTエンドポイントをご確認ください。
アラートインテグレーションを設定する前に、チャットインテグレーションまたはアラート以外のインテグレーションを設定することをお勧めします。
ルールエンジン 🔗
ルールエンジンはフルスタックのサービスレベル機能です。特定の条件を設定し、その条件が満たされたときに、アラートに画像/リンク/注釈の注釈を付けたり、アラートフィールドを上書きしたり、新しいフィールドを追加したりといったカスタムアクションをトリガーできるルールエンジンです。
チームアクティビティとパフォーマンスのレポート 🔗
管理者として、継続的に改善するためには、チームの活動とパフォーマンスを追跡し、報告できることが重要です。トップナビゲーションメニューのレポートページに移動します。
インシデント後レビュー 🔗
インシデントの履歴インサイトを把握し、問題解決方法を文書化します。
パフォーマンス(MTTA/MTTR)レポート: Splunk On-Callへの投資とDevOpsの実践について説明します。
オンコールレポート:オンコールに費やされた時間と、チーム/ユーザー別のインシデント数を確認できます。
インシデント頻度レポート:インシデントの流れを事後的に分析することで、システムの問題を引き起こしているインシデントを解決するための上流工程に進むことができます。
ライセンス番号の調整 🔗
Splunk On-Callライセンス数の大幅な増減が必要な場合は、地域営業マネージャーまたはカスタマーサクセスマネージャーにご相談ください。誰に依頼すればよいかわからない場合は、victorops-sales@splunk.comまでお問い合わせください。