SpeedData

クラウド監視

クラウド監視を極める―デジタル時代における中断のないパフォーマンスの確保

2023年12月22日
翻訳: 島田 麻里子

この記事は米Catchpoint Systems社のブログ記事「Mastering Cloud Monitoring: Ensuring Uninterrupted Performance in the Digital Era」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。


急速な技術進歩が著しい時代において、クラウドは変革の力として台頭し、企業がデータを保存、管理、処理する方法に革命をもたらしてきました。

業界レポートによると、大企業の90%がすでにマルチクラウド環境を導入しています。
2020年、世界のクラウド市場規模は約3,714億ドルに達し、その勢いはとどまるところを知りません。
2025年には、世界のクラウド市場は8,320億ドルを超えると予測されており、年平均成長率(CAGR)は17%を超えるとみられています。

しかし、クラウドの飛躍的な期待の裏側には、無視できない課題が潜んでいます。
それは、注意深く包括的なクラウド監視の重大な必要性です。
ダウンタイムが莫大な損失や風評被害に繋がる時代において、クラウド監視の重要性はいくら強調してもしすぎることはありません。

ここでは、クラウド監視をマスターする方法を紹介しましょう。

クラウド監視が重要な理由

クラウド監視の重要な役割は、NetflixやAdobeなどの有名企業を含む主要サイトに影響を与えた2020年のAWS障害や、世界中の組織にとって重要なサービスに影響を与えた2023年のMicrosoft Azureのダウンタイムなどのインシデントで明らかになりました。
ダウンタイムが収益の損失、評判の低下、ユーザの信頼の低下に直結する世界において、クラウド監視は以下の4つの重要な側面を監視することで、パフォーマンス、セキュリティ、信頼性を確保することができます。

到達可能性
これには、エンドユーザがアプリケーションに正常にアクセスできるようにすることが含まれています。
可用性
エンドユーザが一貫してアプリケーションを利用できるようにすること。
パフォーマンス
アプリケーションのパフォーマンスが期待される基準を満たしているかどうかをチェックします。
信頼性
長期間にわたって一貫したアプリケーション・パフォーマンスを提供すること。

クラウド監視の主な構成要素

クラウド・プロバイダは高い可用性を目指していますが、ダウンタイムを完全に免れるシステムはありません。
だからこそ、あなたが提供しているクラウドベースのサービスに問題が発生したときに、他人が教えてくれることに頼ってはならないのです。
問題が発生した場合、ユーザはクラウド・プロバイダではなく、御社を責めるでしょう。

したがって、インターネットの可用性やその他の側面を監視することは非常に重要です。
クラウド監視の以下の構成要素は、信頼するクラウド・プロバイダに関わらず、信頼できるサービスを維持するために極めて重要です。

#1. アップタイムとダウンタイム:クラウドサービスとアプリケーションの可用性を監視

これには、稼働時間の指標を追跡し、サービスの障害や中断が発生した場合にアラートを生成することが含まれます。

例1:2023年9月20日14:48(UTC)頃、Salesforce Commerce Cloudは、Commerce CloudやTableauなどの様々なクラウドに影響を与える大規模な障害に直面しました。
ユーザはログインできず、どの機能も使用できませんでした。

Salesforce Commerce Cloudの混乱を示すウォーターフォール
Salesforce Commerce Cloudの混乱を示すウォーターフォール

例2:2023年9月23日14:28(EDT)頃、ブラジルのフォルタレザでGoogleのクラウドサービスGlobeNetが利用できなくなりました。

Googleクラウドの可用性問題を示すウォーターフォール
Googleクラウドの可用性問題を示すウォーターフォール

例3:2023年9月21日14:47(EDT)頃、ベラルーシの首都ミンスクでGoogleクラウド(Beltelecom)にSSLの問題が発生しました。

GoogleクラウドのSSL問題を示すウォーターフォール
GoogleクラウドのSSL問題を示すウォーターフォール

#2. サービスレベル合意(SLA):クラウドサービスが定義されたSLAとパフォーマンス保証を満たすようにする

インスタンスとサービスの可用性を表示するSLA監視ダッシュボード
インスタンスとサービスの可用性を表示するSLA監視ダッシュボード

#3. アプリケーション・パフォーマンス:クラウド・アプリケーションの監視はシームレスなユーザ体験にとって極めて重要

お客様が求めているのは、プロバイダ固有のソリューションとは異なる、クラウドに中立的なアプローチであり、途切れないサービスを保証できるソリューションです。

優れたソリューションには、正確な評価のために重要な場所に戦略的にノードが配置されています。
これは、ISP、DNS、CDN、その他のインターネットサービスを考慮し、ユーザジャーニー全体を網羅します。
このような方法は、様々な場所やネットワークにおける実際のユーザ体験を把握し、包括的な評価を行うために不可欠です。

クラウドサービスのエンド・トゥ・エンドビュー
クラウドサービスのエンド・トゥ・エンドビュー

例:2023年9月25日11:33(EDT)頃、Azureは、以下の2つのチャートに示されるように、サーバの応答時間に起因するパフォーマンスの問題が複数の場所で発生しました。

平均テスト時間の増加を示すグラフ
平均テスト時間の増加を示すグラフ
サーバの応答時間の増加を示すウォーターフォール
サーバの応答時間の増加を示すウォーターフォール

#4. 依存関係:APIやサードパーティ・サービスなど、アプリケーションが依存する外部依存関係を監視し、アプリケーションのパフォーマンスに影響を与える可能性のある潜在的な問題を特定

個別のsyntheticテストからは依存関係を監視できる一方、Catchpoint インターネット・ソナーはその作業をあなたに代わって行います。

インターネット・ソナーは、クラウド・プラットフォーム、ネットワーク、DNS、CDN、ホスト、API、セキュリティなど、重要なサードパーティ・サービスの障害を迅速に検出します。
インターネットサービススタック全体を監視し、重要な地域における分析と障害アラートをタイムリーに提供します。
これは、世界最大のノードネットワークで毎日行われる数百万件のテストから得られたデータを使用する堅牢なアルゴリズムによって実現されます。

Catchpoint インターネット・ソナーのグローブビュー
Catchpoint インターネット・ソナーのグローブビュー

#5. 到達可能性:クラウド接続性監視は、ローカルシステムとAWS、Azure、Google Cloudなどのサービスが提供するリモートクラウドリソース(サーバ、データベースなど)間のネットワーク接続を評価する

この例は、到達可能性を追跡することの重要性を浮き彫りにしています。
このネットワーク・サンキー(下記)では、ほとんどのルートが撤退し、ほんの一握りのアクセス可能なルートだけが残り、パフォーマンスの低下に繋がったことが明らかになっています。

ネットワーク・サンキー

監視ソリューションがクラウドのみでないことを確かにする

クラウドからのみ監視するという罠に注意しましょう。
簡単に言えば、クラウド・ベースのコンシューマ・サービスをクラウド内から監視することは、クラウド自体のパフォーマンスを測定するだけであり、エンドユーザが目にするパフォーマンスを測定することにはならないということです。

アプリやサービスが100%クラウドベースであっても、クラウド以外の場所からの監視は必要です。
これには、インターネット・バックボーンやブロードバンド/ISPの拠点、企業内の拠点、消費者のラスト・マイル拠点、モバイルからの監視が含まれます。
これらの視点は、提供しているデジタル体験の完全なビューを提供するために不可欠です。

クラウドの監視はバンテージ・ポイントだけではありません。
データの収集、保存、分析の方法も重要です。
クラウドから監視しているときに、クラウド・プロバイダが障害に見舞われた場合、監視ソリューション全体がダウンするわけにはいかないでしょう。

レコメンド

Catchpoint IPMでクラウドへの投資を最大化

Catchpointのインターネット・パフォーマンス・モニタリング(IPM)プラットフォームは、AWS、Azure、Google、IBM、Alibaba、Tencentなどの主要プロバイダの240のクラウドノードを含む、94カ国の2600以上のバンテージポイントにより、すべてのインターネットレイヤーにわたる広範な洞察を提供します。
これにより、アクセス、ISP、DNS、CDN、その他のインターネットサービスを考慮したエンドユーザ体験の正確な評価が可能になります。
Catchpointのクラウドニュートラルなアプローチにより、クラウドの障害時においても一定の可用性が保証されます。

常に革新を続けるCatchpointは、重要なサードパーティ・サービスの障害を一目で検知できるインターネット・ソナーのようなツールを提供しています。
Catchpointがあれば、安心してクラウドを攻略できます。