SpeedData

インターネットレジリエンスの4つの柱

IPMを極める:不可欠な顧客体験監視フレームワーク

2024年4月26日
翻訳: 島田 麻里子

この記事は米Catchpoint Systems社のブログ記事「Mastering IPM: The Essential Customer Experience Monitoring Framework」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。


インターネット・パフォーマンス・モニタリング(IPM)ベスト・プラクティス・シリーズの前回では、重要なものを重要な場所から監視することの重要性を探りました。

ここで、インターネット・レジリエンスの中核となる側面に焦点を当てましょう。
顧客体験(Customer Experience=CX)です。

このブログでは、平均検出時間(MTTD)と平均修復時間(MTTR)の短縮を達成する上で、IPMが果たす重要な役割について案内します。
まず、どのようなデジタルサービスにも不可欠な基本要素である到達可能性、可用性、パフォーマンス、信頼性について説明しましょう。

完璧な顧客体験のための監視の4本柱

今日のデジタル環境において、完璧なCXを提供することは譲れません。
あらゆる市場やニッチな分野で、コンテンツ配信、可用性、パフォーマンスの一貫性が求められます。
ユーザはアプリケーションの応答性に大きな期待を寄せており、期待に応えられない場合はすぐに別のソリューションに乗り換えるでしょう。

マズローの「欲求の階層」が人間の幸福のための基本的な要件を概説しているのと同じように、私たちが提供するサービスにも同様の枠組みを当てはめることができます。

インターネット・レジリエンスの4つの柱
インターネット・レジリエンスの4つの柱

IPMに特化し、シームレスなCXを実現するために必要なものを4つの柱に集約しました。

到達可能性(Reachability)
デジタル・インタラクションの出発点は、ユーザのリクエストが滞りなくサーバに届くようにすることであり、顧客体験の最初のトーンを設定することであると言えます。
可用性(Availability)
真の可用性とは、"HTTP 200 OK "レスポンスにとどまらず、アプリケーションのすべての機能が意図したとおりに動作することを保証することです。
例えば、eコマースサイトの画像や説明文の読み込みに失敗した場合、ユーザはそのサイトを完全には利用できません。
パフォーマンス
この柱は、アプリケーションのスピードと応答性に焦点を当てます。
競争力のある顧客体験を提供するために、業界リーダーに対するパフォーマンスをベンチマークすることです。
信頼性(Reliability)
信頼性の特徴は、到達可能性、可用性、パフォーマンスを一貫して提供するアプリケーションの能力であり、どのような状況であっても、すべてのユーザが均一な体験を得られるようにすることです。

基本的なレベルでは、サービスは稼働していなければなりません。
ひとたびサービスが利用可能になれば、ユーザはその速さを期待します。
次に、ユーザが世界中のどこからでもサービスにアクセスできるようにするか、少なくともターゲット市場内のすべての地域からアクセスできるようにする必要があります。

そして最後に、Webサイトはその可用性、パフォーマンス、到達可能性において一貫していなければなりません。

これらの柱はそれぞれ、全体的な顧客体験を形成する上で極めて重要です。
これらの側面を綿密に監視することで、潜在的なインシデントを事前に特定し、ユーザ・インタラクションを最適化することができます。

IPMによる顧客体験スイートの導入

IPM CXスイートの実例を見てみましょう。

このフレームワークは、ユーザ体験を継続的に可視化し、潜在的な問題を迅速に特定して解決します。
このようなセットアップを導入することで、企業はWebサイトのパフォーマンスの低下やセキュリティ証明書のエラーなど、カスタマージャーニーに悪影響を与えかねない問題を回避することができます。

15年にわたる比類なき経験を持つCatchpointは、IPMのエキスパートです。
私たちはベストプラクティスと方法論を完成させ、グローバルな業界リーダーにトップクラスのデジタル体験を提供しています。

以下は、堅牢なCX監視セットアップのスナップショットです。

単一オブジェクトテスト
画像やスクリプトなどの個々の要素が正しく読み込まれるように監視します。
DNSエクスペリエンス・テスト
DNS解決プロセスが効率的に機能し、ユーザを滞りなくWebサイトに接続できるようにします。
トレースルートテスト
ネットワーク・トラフィックがサーバに到達するまでの経路を把握し、潜在的な遅延を特定するのに役立ちます。
SSLテスト
セキュリティ証明書の有効性と期限をチェックし、ユーザを不安にさせるようなセキュリティ警告を防ぎます。
Chromeトランザクションテスト
複雑なトランザクションやアプリケーションフローをテストするために、ユーザインタラクションをシミュレートします。

各テストは、分単位で表される特定の頻度で実行され、徹底的なテストとリソース効率のバランスをとっています。

テストタイプ ノードタイプ 頻度(単位:分)
単一オブジェクトテスト バックボーン 5
DNSエクスペリエンス・テスト バックボーン 5
トレースルートテスト バックボーン 5
SSLテスト バックボーン 1,440(1日1回)
Chromeトランザクションテスト バックボーン 60

これらの頻度とテストの種類は、典型的なユースケースに合わせたものであることに注意する必要があります。
サービス固有のニーズによっては、頻度を1分以下の間隔に増やしたり、より詳細なビューのために追加のテストを組み込んだりすることもできます。

このようなスイートを監視戦略に統合することで、アプリケーションのパフォーマンスと可用性、DNS解決、TCPレイヤーの接続性、証明書の健全性、およびユーザ・トランザクション機能を包括的に可視化し、優れた顧客体験を確保することができます。

さて、理想的なCXの設定について考えたところで、有名なファイル共有会社が最近起こした事件を調べてみましょう。

同様のセットアップが、いかに迅速な障害検知、MTTDの高速化、そして最終的な問題の早期解決に貢献したかを考察しましょう。

障害ケーススタディ:何が起こったのか?

2023年12月15日、太平洋標準時の午前6時から午前9時11分まで、著名なファイル共有会社を大規模な障害が襲いました。
この障害は、ファイルツール、API、ユーザログインなど数多くの重要なサービスに影響を与え、アップロードとダウンロードの中核機能が損なわれました。
その結果、無数のユーザがファイルの共有やアカウントへのアクセスができなくなり、ビジネスや個人的な業務に決定的な支障をきたしました。

早期発見:IPMの役割

障害の継続時間を決める重要な要因のひとつは、いかに早く障害を発見するかということです。

このケースでは、プロアクティブなIPMが重要な役割を果たしました。
当社のIPMプラットフォームは、公式の報告時刻よりもかなり前の午前4時37分(太平洋標準時)に、重大なAPI障害の最初の兆候を検知してアラートを発しました。

障害検知

アラートの評価:偽のアラートと本物の脅威を区別する

アラートを受け取ったとき、どのチームにとっても次の疑問は明らかです。
誰かを叩き起こす意味があるのか、それとも誤検知なのか。
ネットワークエラーなのか、アプリケーションエラーなのか。

このケースでは、5XXエラーという一貫したパターンがログに現れ、緊急の注意を要する本物の重大な問題があることを示していました。

ログ

障害の範囲を確認する

対応チームにとって重要なステップは、障害の範囲を特定することです。
APIだけなのか、他のサービスも影響を受けているのか?
このステップは、適切な対応戦略を策定するために不可欠です。

このシナリオでは、API、アップロード、ダウンロード、ログインを含む複数のサービスからの同時アラートが、広範囲に及ぶ障害の状況を描き出し、対応と復旧の戦略を知らせました。

同時

潜在的な影響の分析

ここで説明したような障害は、業務を中断させ、深刻な財務的影響をもたらす可能性があります。
Catchpoint社の委託を受けたForrester Consulting社による 2023年の調査では、Eコマース企業はインターネットの障害により年間数百万ドルの損失を被ることが明らかになりました。

Forrester社によると、回答者の88%が、調査までの1ヶ月間に、障害によって10万ドル以上の損失を被ったと推定しています。
1年間では、年間120万ドルの損失となります。
さらに、51%が前月だけで50万ドル以上の損失を被ったと報告しています。

CXのための強固なIPM戦略を持つことは不可欠です。

この障害は3時間強に及びましたが、IPMによる早期発見がなければ、もっと長引いた可能性があります。

到達可能性、可用性、パフォーマンス、信頼性の4つの柱は、優れたCXのバックボーンを形成します。
最近のファイル共有会社の障害は、IPMの早期発見が、ビジネスに影響が出る前に問題を発見し修正することで、潜在的な損失を抑制するのに役立っていることを物語っています。

IPMベストプラクティスシリーズの次回の更新では、サービスレベル目標の追跡における中立的な第三者データの重要な役割と、サービスレベル契約の課題をどのように乗り切るかについて掘り下げます。