SpeedData

SREレポート2024

2024年SREレポートの洞察: SREにおけるサードパーティモニタリングの重要な役割

2024年7月8日
翻訳: 竹洞 陽一郎

この記事は米Catchpoint Systems社のブログ記事「2024 SRE Report insights: The critical role of third-party monitoring in SRE」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。


2024年のSREレポートは、特に直接の管理外にあるサービスの信頼性と監視に対する組織のアプローチにおける重要な変化を強調しています。
レポートによると、64%の組織が、生産性やエクスペリエンスを妨げるエンドポイントを物理的な管理外であっても監視する重要性を認識しています。

信頼性の実務者は、生産性やエクスペリエンスに影響を与えるエンドポイントを戦術的に監視するべきだと思いますか?それが彼らの物理的な管理外であっても?

「コントロールについて考えるとき、私はAsk.com(旧Ask Jeeves)の生産運用チームでの時間を思い出します」と、SREレポートの著者であるレオ・バシリウ氏は言います。

私たちはGoogleと関係を持っていて、Googleの広告呼び出しは最も監視されているエンドポイントの一つでした。
なぜかというと、それに問題が発生すると(つまり収益源の一つに問題が発生すると)、私たちのCEOはGoogleではなく、私たちのオフィスに来て、それがいつ修正されるかを尋ねていたからです。

組織がサービスの監視に対するアプローチを変えることは、従来のパラダイムからの大きな転換を示しています。
これは、現代のウェブの複雑さとサードパーティサービスへの依存が、レジリエンスを確保するためにより包括的なアプローチを必要とすることを認識しているのです。

全員同意見 - 信頼性は団体競技

SREレポートの重要なハイライトの一つは、回答者の組織内のランク別に分析した結果です。
この洞察に富んだ特徴は2023年のSREレポートで導入されました。

以前の調査結果では、AIOpsから得られる価値、ツールの乱立がどれほど問題であるか、責任追及をしない文化の認識など、いくつかの重要な分野で実務者と管理者の間に不一致があることが明らかになりました。
しかし、外部のエンドポイントを監視する必要性に関しては、すべての組織レベルでのコンセンサスが得られており、優先事項の珍しい意見の一致を強調しています。

信頼性の実務者は、生産性やエクスペリエンスに影響を与えるエンドポイントを戦術的に監視するべきだと思いますか?それが彼らの物理的な管理外であっても(ランク別)?

個々の貢献者とビジネスリーダーは、現代の信頼性実践にはサードパーティサービスが含まれるべきであることに全員一致で同意しました。
組織のランクが上がるにつれて、この質問に対する同意の上昇傾向に注目してください。

この傾向は、階層を超えた共有の優先事項を示すため重要です。
これは、サードパーティの監視の重要性の理解が技術的な問題にとどまらず、戦略的な必要性としても認識されていることを示唆しています。
これは、サードパーティサービスの可視性を得るために必要なツールや戦略を実施するためのリソースと経営陣の支援を確保するために重要です。

サードパーティサービスに依存する危険性

Webサイトにサードパーティのソフトウェアを統合することは、利点と課題の両方を提供します。
eコマースのウェブサイトやプラットフォームは、顧客体験のパーソナライズ、ライブチャットサービスの提供、変更がユーザーのやり取りに与える影響の分析など、その機能を強化するために複数の外部アプリやツールに依存することがよくあります。
これらのサードパーティのソリューションは、インタラクティブな要素を追加するために重要ですが、同時にユーザー体験に混乱を引き起こす可能性もあります。

あなた、もしくはあなたのチームは、これらのいずれかを監視していますか?

インターネットスタックのどの単一障害点もシステムを壊す可能性があることを考えると、信頼性エンジニアリングの範囲内でサードパーティサービスを組み込むことは非常に重要です。
レポートでは次のように述べています。

信頼性とレジリエンスを推進するためには、監視戦略にサードパーティベンダーを含める必要性がますます高まっています。
私たちは、この信頼性作業の領域を、会社の『四壁』を越えてより良い関係を構築し、BGPやSASEなど、あまり監視されていないインターネットスタックの領域について学ぶ機会として見ています。

制御喪失における機会

「フィールドからの視点」コメントでは、サラ・バット氏とアレックス・エルマン氏が、デジタルエコシステムの特定の側面に対する制御の喪失が後退ではなくユニークな機会を提供することを提案しています。
アーキテクチャを分散化し、責任を共有することで、「チームはコアコンピテンシーに集中し、非コア領域では他の専門家に依存することができます。 このダイナミックな状況は、複雑な社会技術システムで新しい作業方法を導入するためにしばしば必要かつ有益です。」

二人はまた、「マルチパーティジレンマ」にも言及しており、これは特にインシデント時に相互依存する組織間の交差点で直面する課題を表しています。
このダイナミックな状況を効果的にナビゲートするために、彼らは相互性を高め、共有の参照枠を確立し、非対称性を減少させるための活動を提案しています。
詳細はレポートをご覧ください。

近日公開:サードパーティ監視の新しいビジョン

今日利用可能なほとんどのアプリケーションパフォーマンス監視(APM)プラットフォームは、インターネットスタックへの洞察をほとんど、または全く提供していません。
この可視性の欠如が、多くの組織がレジリエントなデジタル体験を提供するのに苦労する理由です。
ITチームは、本質的に第三者サービスに依存するアプリケーションの包括的なビューを欠いており、ほとんど手探りの状態で運用しています。

インターネットスタックの統一ビューがあり、すべての依存関係が単一のダッシュボードにマッピングされることを想像してください。
それがあなたの制御外のものであってもです。

Catchpointプラットフォームに近日登場するのは、組織の重要なサービスやアプリケーションの内部およびサードパーティのすべての重要なコンポーネントを自動的に発見する初の機能です。
この画期的なツールは、SREが直面するマルチパーティジレンマに対処し、レジリエントなデジタル体験に必要なプロアクティブな可視性を提供します。
続報をお待ちください。

2024年のSREレポートを今すぐお読みください(登録不要)。