ニュース

オブザーバビリティ vs. モニタリング ― 観測 対 監視

2021年12月16日
翻訳: 島田 麻里子

この記事は米Catchpoint Systems社のブログ記事 Observability vs. Monitoringの翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。


「モニタリング」という言葉を定義することは、パフォーマンス空間が年々大きく進化していることを考えると、難しい課題です。
最近、モニタリングの世界にも変化があり、モニタリングの定義や目的に関する健全な議論が行われ、その中で「オブザーバビリティ(可観測性)」という新しい言葉が生まれています。
その議論の一部は、Charity Majors氏とCindy Sridharan氏のブログに掲載されています。

AirBnB、Twitter、Stripeなどの多くの企業は、オブザーバビリティチームやオブザーバビリティエンジニアといった役職を作って、オブザーバビリティを取り入れています。

では、モニタリングとオブザーバビリティの違いは何でしょう。
そしてどのような関係があるのでしょうか?
モニタリングはオブザーバビリティの部分集合なのか、オブザーバビリティがモニタリングの部分集合なのか、それともこの2つの用語は同じ意味なのか?

パフォーマンス・モニタリングとは、

などを含む包括的な用語です。
あなたの役割の性質によって、モニタリングの意味が変わってきます。

モニタリングの目的は何でしょうか?

シンプルな答えはこうです。
システムの問題点を検出し、エンドユーザへの影響を最小限に抑えること。
言い換えれば、モニタリングのポイントは「発見」です。

モニタリングは、定期点検で車を整備工場へ持ち込んだ際に、エンジン警告灯が点灯するときと似ています。
車はできるだけスムーズに走らせ、故障を防げるようにしておきたいですよね。
Web上であれば、ユーザがアプリケーションやサービスにアクセスできるかどうか、またそれらが適切な閾値内でパフォーマンスを発揮しているかどうかを知りたいものです。

アラートは、何かが最適に動作していないときや壊れている場合にチームへ通知するよう設定されています。
しかし、アラートを設定する前に、ベースラインを作成し、環境の現状を把握することが重要です。
私にとっては、ここで初めてオブザーバビリティが意味を持ちます。

システムをオブザーブ=観測しなければ、何が正常で何が異常なのかを知ることはできません。
システム、サービス、アプリケーションを観測することによってのみ、私たちは何が問題なのかを判断することができます。

企業は、サービスやアプリケーションの状態を常に観測し、以前に設定したアラートでは検出されなかった異常値や異変を探す必要があります。
データポイントを集計して、平均値、中央値、パーセンタイル、またはその他の消費可能な統計値を作成することも時には有効ですが、隠れた洞察を明らかにするであろう異常値やパターンを見つけるためには、集計されていないデータへアクセスする必要もあります。

異変や異常値が常にアラートを発するとは限らず、また、常にアラートを発するべきでもありません。
異変は、私たちをシステムのより深い洞察に導いて、追加の文脈を提供し、重要な属性を特定するのに役立ちます。
アラートの有無に注目するだけでは、物語の大きな部分を見失ってしまうのです。

観測にはどのようなツールが使えるのでしょうか?
オブザーバビリティエンジニアの職務経歴書やブログを読み込むと、彼らはチャートやビジュアライゼーション、分散型のトレースツール、ログ、モニタリングサービスなどを頼りにしています。

モニタリングとオブザーバビリティには明らかに密接な関係があります。
この観察アラートや通知が設定可能である事、より深い洞察を得ることが可能である事を通して、モニタリングは企業がパフォーマンスを観測できることを可能ならしめるのです。
これらの洞察により、チームは情報を得て、維持のためのデータに基づく決定を行い、改善もしくはサービスやシステムを入れ替えることが可能となります。

モニタリングとオブザーバビリティは、高いパフォーマンスを発揮するITチームには共に不可欠な要素です。
データはモニタリングシステムから収集され、分析され、実行される必要があります。

どのようなデータを収集し、報告すべきかについての詳細は、Catchpoint社の最新のeBook「Measure What Matters」をご参照ください。