
エンタープライズ・オブザーバビリティの統合と近代化
IPMでオブザーバビリティの運用とコストを最適化
2025年2月4日
著者: Gerardo Dada
翻訳: 逆井 晶子
この記事は米Catchpoint Systems社のブログ記事「Consolidation and Modernization in Enterprise Observability」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。
組織はオブザーバビリティへの投資によって、問題解決の迅速化、コスト削減、ビジネス成果の向上といった測定可能な利益を得ています。
しかし、コストの増大、ツールの分散、インターネットへの依存やユーザ体験の包括的な監視の必要性など、依然として課題が残っています。
これらの課題と、それに対処するために組織が採用しているベストプラクティスについて探っていきます。
オブザーバビリティコストへの懸念の高まり
オブザーバビリティは高価すぎます。
2022年の決算発表において、Datadogはあるお客様がオブザーバビリティツールに6,500万ドルを費やしていることを明らかにしました。
このニュースにより、オブザーバビリティコストの高騰への関心が一層高まりました。
ジェレミー・バートン氏は次のように述べています。
一部のオブザーバビリティツールベンダーは、組織がITシステムの監視と状態の把握に、総インフラストラクチャコストの最大30%を割り当てるべきだと言っています。
それはまったく馬鹿げています。
MELTの過信がコスト上昇を招く
コスト増大の根本的な原因の一つは、オブザーバビリティの「3つの柱」(現在のMELT:インフラメトリクス(infrastructure Metrics)、イベント(Events)、ログ(Logs)、コードトレース(code Traces))を盲信し、すべてをこの方法で監視しようとする考え方です。
特にストレージベンダーは、ログがストレージのニーズを大幅に高めるため、ログを好みます。
今後、監視のためのツールファーストのアプローチは放棄されると予想されます。
その代わりに、アプリケーションやインフラストラクチャの重要度と監視データの価値に基づいて、最適な監視方法を決定するアプローチを採用するようになるでしょう。
複数のAPMツールを管理する課題
多くのITリーダーは、それぞれ独自の機能、ダッシュボード、データソースを持つ複数のAPM(Application Performance Monitoring)ツールを管理するという課題に直面しています。
この分散は、チームが問題を特定して解決するために、さまざまなツールからのデータを関連付けることに貴重な時間を費やすため、効率が下がる可能性があります。
2024年のSREレポートによると、大規模企業の多くは5つ以上のオブザーバビリティツールを使用しています。
この多様性は、多くの場合、アプリケーションチームの好みに起因しています。
私の経験では、大規模企業のほとんどは、主要なAPMプラットフォームのうち上位5つのツールを組み合わせて使用しています。

APMの未来:ツールの統合、OpenTelemetry、コスト削減
Elasticの最近の調査によると、多くの組織が、より迅速なインサイトの獲得とチーム間のコラボレーション向上を目指し、オブザーバビリティと監視ツールの統合を検討しています。
APMツールを統合する最も魅力的な理由の一つは、コスト削減の可能性です。
ツールの数を減らし、単一のプラットフォームに標準化することで、組織はライセンスコストを削減し、トレーニング費用を削減し、メンテナンス作業を効率化することができます。
OpenTelemetry(Otel)はオブザーバビリティの世界におけるゲームチェンジャーとして登場しました。
オープンソースプロジェクトとして、アプリケーションからテレメトリデータ(メトリクス、ログ、トレース)をキャプチャしてエクスポートするための一連のAPI、ライブラリ、エージェント、およびインストルメンテーションを提供します。
OpenTelemetryの採用は勢いを増しており、多くの組織がデータ収集の標準化とベンダーロックインの削減の可能性を認識しています。
これはオブザーバビリティのトレンド#1です。
企業は新しいオブザーバビリティの要件としてOpenTelemetryの採用を義務付け始めています。
これにより、ベンダーロックインの解消、監視データの統合、チームの柔軟性向上が可能となります。
一部のチームはオープンソース技術を検討していますが、「オープンソースは子犬のようなもの(無料だが手間がかかる)」と言われるように、維持には多大な労力が必要です。
多くのユースケースでは有効ですが、オブザーバビリティに関しては、完全なオープンソーススタックを構築・設定・統合・維持する労力が、最適化された商用プラットフォームのコストを容易に上回ることに、多くのチームがすぐに気付くのです。
オブザーバビリティの中央集権化
オブザーバビリティの複雑さが増し、支出とプラットフォーム採用に対する精査が厳しくなっているため、オブザーバビリティに関する意思決定の一元化が進んでいます。
これはオブザーバビリティのトレンド#2であり、企業は中央運用チームを設立し、オブザーバビリティを管理するか、もしくは標準・プロセス・ベンダー・ガバナンスを定義するアーキテクチャチームを構築しています。
これらの中央運用チームは、まず アプリケーション、ベンダー、ツール、レポート、重要なニーズのインベントリを作成することから始めます。
その後、優先事項、標準、ベストプラクティスを定義していきます。
この傾向は今後さらに加速すると予想されます。
分散型・インターネット中心のサービスと依存関係の監視の必要性
APMツールはオブザーバビリティの確立された要素ですが、システム中心の視点に偏りすぎている という認識が高まっています。
現代のアプリケーションは デジタル化、クラウド化、分散化、API中心化 が進んでおり、多数の外部サービスに依存しています。
そのため、これらのサービスもグローバルインターネットのパフォーマンスと可用性に大きく影響を受けます。
この重要性は、「本当に重要なのはシステムの稼働時間やコードの効率ではなく、リアルなデジタルユーザ体験である」という認識によってさらに強調されています。
ユーザーが世界のどこにいても、最適なエクスペリエンスを提供することが求められます。
APIを通じて提供されるサービスにおいても、重要なのはシステム内部指標ではなく、インターネットを介して他のシステムが実際にどのようなエクスペリエンスを得るかです。
現代の企業は、「顧客体験=デジタル体験」であり、「デジタル体験=顧客体験」であることを認識しています。
ほとんどのオフライン業務でさえ、体験の質を定義するデジタルシステムによってサポートされ、依存しています。
例えば、レンタカー会社にとって重要なのは、クラスタ予約システムのCPU使用率が平均72%であることではありません。
それよりも、20分待たされたお客様がカウンターで「すみません、コンピューターが遅くて…」と言われ続けないことの方が重要です。
その結果、オブザーバビリティのトレンド#3が確立されました。
オブザーバビリティスタックにおいて「Internet Performance Monitoring(IPM)」は不可欠な要素となります。
EMAの最新レポートでは、
「Internet Performance Monitoringツールは、アプリケーションパフォーマンス管理と同等か、それ以上に重要になっている」
と述べられています。
インターネットスタックの要素やインターネット中心の依存関係によって引き起こされる障害が増加しているため、GigaOMが「IT意思決定者は、これらの障害の全責任を負うか、またはそれらを賢く乗り切るためのIPMソリューションに投資するかの選択を迫られている」と書いているのも当然のことです。
完全なオブザーバビリティの方程式
これらのトレンドの組み合わせにより、先進的な企業ではAPMプラットフォーム(上位3つのうちの1つ)とIPMプラットフォーム(CatchpointやCisco ThousandEyesなど)を組み合わせることが一般的になっています。
APMは内側からの視点を提供し、IPMは外側からの視点を提供します。
APMは システム中心の可視性を提供する一方、IPMは グローバルなデジタルエクスペリエンスとインターネットの健全性を可視化します。
洗練されたIT運用組織では、レジリエンスと最適なパフォーマンスを追求するために、DynatraceとCatchpointの組み合わせが好まれることがよくあります。
これらのチームは、オブザーバビリティの成熟度が比較的高く、単にプロアクティブであるだけでなく、価値主導型かつビジネスへの影響を重視する段階にあることが特徴です。

このアプローチを採用した現代の企業は、運用効率の向上、稼働時間の大幅な増加、ユーザ体験の改善を実現しており、ビジネスに明らかにプラスの影響を与えています。
これはまた、ITとビジネス戦略のより良い連携、そしてIT運用チームがもたらす価値の認識にもつながります。
SAP、IKEA、Akamai、そして北米有数の金融サービス機関といった企業が、このモデルで成功を収めている例です。
結論
ITリーダーがIT運用の複雑さを乗り越える中で、進化する監視とオブザーバビリティ、APMツールの統合、OpenTelemetryの採用、そして集中管理されたチームからのガバナンスとベストプラクティスを用いたIPMの実装は、大きな利点をもたらす可能性があります。
オブザーバビリティ戦略を合理化することで、組織は問題解決の迅速化、コスト削減、そしてより良いビジネス成果の推進を実現することができます。