Scenario: Improve storage use and costs by routing and archiving your data 🔗
以下のシナリオは、架空のeコマース企業であるButtercup Gamesの例です。
背景 🔗
SkylerはButtercup Gamesの中央observabilityチームの管理者です。Skylerは、会社の予算内に収まるように、様々なチームのobservabilityの使用状況を監視しています。
Lately, Skyler has been noticing an increase in their metric time series (MTS) usage. With the help of the Splunk Observability Cloud account team, Skyler obtains a detailed metrics usage report. The report gives Skyler insights into their MTS volume, use of dimensions with high cardinality, use of those MTS in charts and detectors, and distribution of MTS across different teams.
Skyler は、あるチームが割り当てられた使用量の上限に近づいていることに気づきます。Skyler はそのチームのサイト信頼性エンジニア(SRE)リードである Kai に連絡を取り、チームの使用量を最適化するよう依頼します。Skyler は、カーディナリティの高いディメンションの MTS、MTS の総使用量、チームの MTS 使用量を Kai に伝えました。
調査結果 🔗
The metrics usage report shows that Kai’s team sends about 50,000 MTS for the service.latency
metric to Splunk Observability Cloud, but not all the MTS at full granularity are essential. Kai looks at the report to understand more about the cardinality of different dimensions.
Kai は、彼らのチームがヨーロッパのデータセンターのサービス遅延のパフォーマンスだけを気にしていることを知っているので、data_center_region = Europe
のデータだけをフィルターリングしています。しかし、他のデータをさらに深く調べたい場合に備えて、最近のデータにもアクセスできるようにしておきたいと思っています。
アクション 🔗
Kai decides to use Archived Metrics to control how Splunk Observability Cloud stores their team’s data.
Splunk Observability Cloud で、Kai は Metrics Pipeline Management に入り、メトリクス
service.latency
を検索し、取り込みルートを Archived Metrics に設定します。これで Kai はすべての MTS を Archived MTS として見ることができます。Kai はルート例外ルールを作成し、
data_center_region = Europe
の場合にフィルターを指定します。これにより、2,497件のリアルタイム MTS が推定されます。Kai はまた、前の時間のデータを復元し、ギャップがないことを確認します。Now, Kai views the list of charts and detectors that use
service.latency
. To learn more about viewing or downloading the list, see Understand your metrics usage with the metrics usage report.Kai はすでにチャートとディテクターに
data_center_region = Europe
のフィルターを設定していました。Kai はチャートの1つにデータが表示されていることを確認します。Kai は Metric Pipeline Management のメトリクス
service.latency
を再度表示し、MTS の推定値を確認します。推定値は、リアルタイムの MTS カウントが50,000から2,497へと95% 減少したことを示しています。
概要 🔗
MTS の一部をアーカイブし、リアルタイムにルーティングすることで、Kai とSkyler は Buttercup Games のストレージコストを削減しながら、MTS の使用量を全体的に削減し、使用量の上限を下回ることに成功しました。
さらに詳しく 🔗
To learn more, see the following docs: