進化したITOps監視
Catchpointが支援するより総体的な監視戦略の構築
2022年4月22日
翻訳: 島田 麻里子
この記事は米Catchpoint Systems社のブログ記事 IT Operations Monitoring, Evolvedの翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。
リモートワークへの移行は、ほとんどの企業や事業者にとって未曾有の挑戦でした。
プロセスやワークフローを保守するため、IT運用部門を迅速に立ち上げなければなりませんでした。
監視ツールは、ITOpsがインシデントを分析し、迅速に解決するために必要なあらゆることを可能にする上で、重要な役割を担っています。
Gartner社によると、多くの企業、特にDX化を遂げていたり現在取り組み中である企業は、今や監視を事業継続に不可欠な機能として捉えており、COVID-19はこの傾向を早めている
とのことです。
Gartner社は「Strategic Roadmap for IT Operations Monitoring」において、IT監視戦略は実用的なオブザーバビリティを実現し、フルスタック(共有およびインコンテキスト)からの遠隔測定を分析することによって、デジタルビジネスアプリケーションと顧客体験(CX)に影響を与える関係性と依存性を検出する
必要があると述べています。
IT監視戦略には、進化するデジタル環境に遅れを取らないためのオーバーホールが必要です。
インフラストラクチャーとオペレーション(I&O)のリーダーは、監視戦略が2021年においても適切かつ効果的であることを確認するために、これを再評価する必要があります。
このような戦略には、最新の監視ソリューションが不可欠です。
この記事では、ITOpsの監視戦略を評価する際に考慮すべき2つの重要な側面について説明します。
- ITOpsにおけるオブザーバビリティ
- 異なるチーム(SRE、DevOps、SecOps、ITOps)間で統一された監視アプローチ。
- 総体的監視
- 監視の可視性のギャップを克服し、ビジネス成果とデジタル体験を関連付けます。
オブザーバビリティとITOpsの監視
監視には様々なアプローチがあります。
ここで重要なのは、インフラやアプリケーションのアップタイムだけを監視すればよいわけではないということです。
このようなアプローチでは可視性のギャップが生じ、システムがダウンしたときに、様々なチームが慌てることになります。
それよりむしろ、デジタルビジネスの継続性を確保するためには、オブザーバビリティが重要です。
オブザーバビリティは、アプリケーション配信チェーンのあらゆるレベルで、様々なデータソースからのパフォーマンス指標を結びつけます(図1)。
これにより、システムの内部状態と外部出力の関連性をより深く理解することができます。
インフラやその他のアプリケーションコンポーネントをある程度可視化するため、企業は監視ツールに投資しています。
とはいえIT監視の現状は、特定のチーム向けの特定の監視ツールが混在しているような状態です。
異なるツールセットは、インフラ、ネットワーク、アプリケーションの異なる部分に焦点を当てます。
ITOps、DevOps、SecOps、および組織内の他のチームが使用するツールの間の格差は、監視の成熟度を高めることへの障害となり得ます。
組織内でツールが乱立することで、技術的負債、セキュリティリスク、パフォーマンスに関する見解の相違が生じます。
ITOpsは、監視戦略のギャップを克服するためにオブザーバビリティを実践する必要があります。
オブザーバビリティに焦点を当てた監視戦略では、DevOps、SecOps、およびアプリケーション開発チームが、デジタル体験の向上という同じ目標を達成するために連携することになります。
統一された観測可能な戦略により、複数のソースからのデータを容易に分析することができます。
また、強固なオブザーバビリティ戦略によって、インシデント管理が効率化され、トレンドの特定や異常の検出も迅速に行えるようになるのです。
ITOpsは、最善の監視ソリューションに投資することに加えて、次のことを行う必要があります。
- カスタマー・ジャーニーを積極的に監視することで製品・サービスの品質を確保し、ポジティブな顧客体験を維持するために、可用性だけではない指標を含める。
- パフォーマンスとビジネスKPIをリアルタイムで追跡する関連ダッシュボードで、インシデント解決の優先順位を決定する。
- 異なるツールセットとバックエンドシステムをシームレスに統合し、データを活用して組織全体で使用できる統合ダッシュボードを構築できるようにする。
- CI/CDサイクルを監視し、リリースデータを取得することで、顧客体験とバックエンドの間のフィードバックループを作成する。本番前の環境を監視することで、DevOpsプロセスの自動化の機会を見つけることができます。
総体的なIT監視
現代のデジタル環境はますます複雑化しており、様々なコンポーネントやプロセスが膨大な量のデータを扱っています。
コンテナからハイブリッドクラウドサービスまで、開発者は変化するデジタルニーズに合わせて拡張できるアプリケーションを構築し提供するために、多くの異なるテクノロジーに依存しています。
監視戦略は、デジタル環境の変化に合わせて進化させる必要があります。
デジタル体験を維持するためには、インフラ、ネットワーク、デバイスデータ、さらにはユーザ感情まで考慮した「フルスタック」な監視アプローチが必要です。
組織は、監視が「起動しているか?」で終わらないような成熟度を達成するために、総体的な監視ソリューションを活用する必要があります。
成熟した監視戦略(図2)は、様々なアプリケーションコンポーネント、インフラ、外部の依存関係を評価し、デジタル体験の指標をビジネスKPIと関連付けて、プロセスとアプリケーション配信を最適化および改善します。
リモートワークへの移行に伴い、企業は監視戦略の見直しを迫られています。
現在多くの企業では、エンドユーザの使い勝手だけでなく、従業員の生産性を確保するためにも、監視は重要な機能であると考えられています。
監視ソリューションには、新しいデータソースや大容量のデータを取り込んで分析し、新しい形の自動化を導入する必要があります。
企業は、実際のビジネス成果に対してパフォーマンスと可用性を評価する必要性から、最新の総体的な監視ソリューションが必要であることを理解しています。
APMベンダーは、現在のアプリケーション監視モデル(ブラックボックス・エージェント)を見直し、OpenTelemetry[1]、OpenMetrics[2]、および自動化を採用すると思われます。
単なるアプリケーションの健康診断ではなく、データ分析、データの相関関係、ビジネス上の成果などに焦点が当てられることになります。
ITOpsは、以下のような監視ソリューションに投資する必要があります。
- 複数のソースからデータを取り込む ― ソーシャルメディアからのユーザ感情、ビジネスKPI、サービス配信チェーンコンポーネント、ウェブ解析など。
- デジタル体験とビジネス成果を関連付ける高度なデータ分析を提供する。
- より効果的で迅速なインシデント管理の実現のため、自動化を促進する。
- 統合された最善な組み合わせのプラットフォームにより、DevOpsとSecOpsの間のサイロと可視性のギャップを解消する。
[1]OpenTelemetry 分散トレースを標準化するCloud Native Computing Foundation (CNCF)のプロジェクト。
[2]OpenMetrics(from Prometheus) もう一つの重要なCNCFプロジェクト。時系列データの分析に使用されます。
CatchpointでITOpsの監視を強化
COVID-19の影響により、従業員(社内)とデジタルビジネス(社外)の双方にとって、IT監視が不可欠なものであることが確認されました。
しかし、I&Oのリーダーは、リモートワークの運用監視の結果をビジネスの成功目標に繋げることに苦労しています。
本番環境で使用されるAIOpsは、自己修復や修復機能に対する非現実的な期待に応えられないことがほとんどです。
Gartner社は「2021 Strategic Roadmap for IT Operations Monitoring」において、ITOpsの展望を形成し、今後1年間に監視ソリューションの市場成長を促進するグローバル、テクノロジー、ビジネスのドライバーについて概説しています。
同社は多くの企業、特にDX化を遂げていたり現在取り組み中である企業は、今や監視を事業継続に不可欠な機能として捉えている
と報告しています。
下図(図3)は、ITOps監視の現状を評価する際に注目すべき重要な構成要素の概要を示しています。
優れた従業員のエンドユーザ体験を維持し、提供し続けることは、事業継続のために不可欠な機能の一つです。
この分野での真の成功は、ITOpsチームが適切なツールを装備している場合にのみ可能です。
Catchpointは、ITOpsチームがITOps監視の未来像を実現するために必要な基本コンポーネントを提供します。
CatchpointのIT監視には以下の特徴があります。
- 統一的、全体的、機動的
- 組織内の異なるチーム間で使用できる複数の監視手法を備えた単一のプラットフォームで、アプリケーションの各レイヤーに可視性を提供します。
DNS、CDN、BGP、APIなど、あらゆる重要なコンポーネントのパフォーマンスを評価します。 - インテリジェントかつビジネス志向
- 直感的なダッシュボードとデータ分析により、特定の指標の分解、過去の傾向の特定、データの関連付けを行い、パフォーマンスへの影響やビジネスの成長に関する質問に答えることができます。
Catchpointのワークフロー、通知、ベンチマークを、一般的なサードパーティのDevOpsツールと統合することで、トラブルシューティング能力を向上させることができます。
ITOpsは、Catchpointが提供する多様な監視機能を、オブザーバビリティの実践の一環として活用することができます。
Catchpointは、SRE、DevOps、SecOps、ITOpsの各チームの連携方法を再定義し、各チームの効率性と生産性を高める、より総体的な監視戦略の構築にお客様が注力できるよう支援しています。