IPMを極める:重要なことを重要な場所から監視する
「何」を「どこから」監視するか―その重要性
2024年4月17日
翻訳: 島田 麻里子
この記事は米Catchpoint Systems社のブログ記事「Mastering IPM: Monitor What Matters From Where It Matters」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。
IPMベストプラクティスシリーズの第1回では、インターネット・スタックの広大な広がりと、その複雑なレイヤーがどのように一体となってデジタル・サービスを稼動させているかを探りました。
インターネット・パフォーマンス・モニタリング (IPM) が相互接続された世界のレジリエンスにとって極めて重要である理由を理解するための基礎を築きました。
この記事では、重要なものを的確に、適切な視点から監視する必要性に焦点を当てます。
何が重要かを監視する ― しかし、なぜ?
監視はITの世界では当たり前のことであり、ユーザが快適に利用できるようにシステムを監視しなければなりません。
しかし、組織はしばしば根本的な問題に直面します。
それは、多様なソースからの圧倒的な量のデータと、特定の運用とビジネスのニーズにとって本当に重要なものを特定し、監視することの難しさです。
このような複雑さに直面して、多くの組織は、自分たちが直接コントロールできるシステムだけを監視することをデフォルトにしています。
一見すると、この方が論理的で、シンプルに見えます。
しかし、このアプローチは重要な点を見落としています―ユーザ体験を反映していないのです。
ネットワーク全体が「グリーン」に見えても、ユーザが接続できないことがあります。
それは、ユーザが異なる地理的位置から、異なる経路で、異なるリソースを使用してシステムに接続しているためです。
つまり、あなたにとってだけでなく、ユーザにとっても重要なことを監視する必要があるのです。
ユーザの視点から監視することで、障害を防ぎ、ユーザ体験を向上させることができます。
また、ネットワークとユーザのアクセス方法をよりよく理解することで、将来的にパフォーマンスを最適化することができます。
IPMで重要なことを効果的に監視するには
デジタル・エコシステムを効果的に監視するには、アプリケーション・パフォーマンス・モニタリング(APM)という従来のインサイド・アウトの視点を超えた包括的なアプローチを採用することが重要です。
APMは内部インフラとアプリケーションのパフォーマンスと健全性を監視する上で非常に貴重ですが、全体像を把握することはできません。
デジタル・サービスを360度完全に可視化するには、APMをインターネット・パフォーマンス・モニタリング(IPM)と統合することが不可欠です。
IPMは、エンドユーザの視点に焦点を移しますが、これはモニタリング・パズルに欠けているピースであることがよくあります。
IPMは、BGP、SASE、DNS、CDN、WAN、MQTTなどのコンポーネントを含むインターネット・スタック全体を深く可視化します。
あらゆる複雑性を持つインターネットがデジタルサービスのパフォーマンスと可用性にどのような影響を与えるかを全体的に把握できるため、企業はサービス提供に影響を与えるさまざまな要素を理解することができます。
可用性を超えて:実用的なインサイトのための監視
重要なことを監視することは、単に膨大な量のデータを収集することではなく、そのデータから実行可能なインサイトを抽出することです。
戦略目標に沿った主要な指標に焦点を当てることで、組織は情報に基づいた意思決定を行い、パフォーマンスを最適化し、最終的にビジネスの成功を達成することができます。
「HTTP200」のレスポンスが返ってくれば、企業は自社のアプリケーションを利用可能だと考えることが多いです。
しかし、可用性の定義は大きく進化しています。
もはや「HTTP 200 OK」だけに依存するものではありません。
アプリケーションの真の可用性とは、すべてのコンポーネントが問題なく、期待通りに機能することです。
典型例:Adobeの障害
2023年12月8日のAdobeの障害を例にとって考えてみましょう。
マネージド・サービスがHTTP 200ステータス・コードを返したとしても、例えばサードパーティ・サービスの読み込みに失敗し、ユーザが空白のWebサイトや不完全なWebサイトに直面した場合、ユーザ体験が大きく損なわれる可能性があることが再確認されました。
CatchpointのIPMとエンドユーザによる影響の検出
Catchpointのインターネット・ソナーは、Adobeのサービス中断を迅速に特定し、即座に警告を発し、ダッシュボード上で障害の程度を強調して表示しました。
Catchpointのトランザクションテストは、ユーザ・ジャーニーをエミュレートし、ページ上の特定の要素の読み込みをチェックするものですが、失敗が記録され始めました。
これらは、以下のスクリーンショットに示されているように、Adobeのリクエストが期待通りにロードされず、ページが意図した通りにロードされなかったことに起因しています。
アプリケーション・チームは、Adobeのリクエストを一時的に削除することで、事前対策を実施しました。
これにより、意図したとおりにエンドユーザにコンテンツが配信されるようになりました。
この調整の有効性は、以下のスクリーンショットに見られるように、Catchpointのテストによって確認されました。
注目すべきは、「Adobe」のリクエストが削除されると、テストは正常に再開したことです。
重要な場所からの監視
重要なことを監視することは非常に大切ですが、それと同じくらい重要なのは、監視する場所です。
適切な視点から監視することで、障害やパフォーマンス低下時に重要な問題を明らかにすることができます。
- その問題は特定の地域に限定されたものなのか、それとも世界的なものなのか。
- 特定のインターネット・サービス・プロバイダ(ISP)のユーザだけが影響を受けるのか。
- モバイルネットワークでのユーザ体験の質とは。
- ユーザがクラウド環境に限定されないことを考えると、クラウドエージェントのデータだけに依存すべきなのか。
Catchpointの広範なグローバル・オブザーバビリティ・ネットワークは、ユーザ、ネットワーク、デジタル・サービス、アプリケーションにまたがる2500以上のバンテージ・ポイントにより、比類のない可視性を提供します。
このネットワークにより、Catchpointのユーザは重要な箇所を監視し、アウトサイド・インの視点を採用してエンドユーザの体験を正確に測定することができます。
他の監視ソリューションとは異なり、私たちのオブザーバビリティ・ネットワークは独立しており、IPMプラットフォームの原動力となるデータが偏りのない信頼できるものであることを保証しています。
この独立性により、「狐が鶏小屋を守る」ような心配はありません。
さらに、ホスティング・クラウド・プロバイダから切り離されたネットワークを持つことで、ネットワークの耐障害性が強化され、クラウド・プロバイダが停止している場合でも、問題の検出、診断、トラブルシューティング、解決策の確認が可能になり、お客様に並外れた信頼性と保証を提供することができます。
IPMを活用した真のアプリケーション可用性
要約すると、企業は、真のアプリケーションの可用性を実現するには、エンドユーザの視点から、できるだけ多くの多様な視点から監視する必要があるという事実を受け入れなければなりません。
Adobeの障害は、インターネット・スタックの相互接続コンポーネントがエンドユーザ体験にどのような影響を与えるかを理解するためのプロアクティブなIPM戦略の必要性を痛感させるものです。
これは単なるデータ収集ではなく、パフォーマンスを最適化し、ビジネスを成功に導くための実用的なインサイトを抽出することなのです。
IPMベストプラクティスシリーズの次回は、インターネット・レジリエンスの基本について掘り下げます。
顧客体験の向上に焦点を当て、到達可能性、可用性、パフォーマンス、および信頼性の重要な構成要素を探ります。