SpeedData

SREレポート2024

SREレポート2024:読者にとっての重要事項

2024年4月5日
翻訳: 島田 麻里子

この記事は米Catchpoint Systems社のブログ記事「The SRE Report 2024: Essential Considerations for Readers」の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。


SREレポート2024をダウンロードする(登録不要)

「アメリカ英語で最も短く、完全な文は何か」とググると、最初の答えとして"I am"が出てくるかもしれません。
しかし、"Go"も文法的に正しい文であり、"I am"よりも短いです。

これは完璧なルールや文法を論じる記事ではありません(我々はコードをコンパイルしようとしているのではありません)。
例えば、“indirect you”といったオックスフォード・コンマの使い方、ピリオドの後のスペースの数など、基本的なルールは議論の一部……ごもっともです。
しかし、これは、(『SREレポート2024』に書かれているような)言葉や(SREに内包されているような)信頼性プラクティスを、ニュアンスにとらわれず、より良いものにするために使うことができるかどうかについての記事なのです。

「ああ、これはやっているが、これはやっていないからSREとは呼べない」
そうではなく、「毎日少しずつ良くしているか?その過程で学んでいるか?」ということです。

SREレポート2024を読むにあたって、より良いものにするために、私たちはいくつかの追加的なレンズを提供したいと思います。
完璧なルールのリストを提供するのではなく、レポートをより良く読むための方法を提供するのです。

SREレポートとは?

それは単純なことです。
SREレポートは、(デジタルの)信頼性に関心を持つすべての人を対象とした独立した調査です。
このレポート(The SRE Report 2024は第6版となる)を書くというアイデアは、Googleに触発され、コミュニティによって発展したものです。

今年のインサイトのセクション別統計は?

以下は、今年のインサイト統計セクションです。
これらを列挙し、そして探っていくことにしましょう。

インサイト1
コントロールを失うことで、人間関係と学習の新たな機会が生まれる
64%の組織が、生産性や体験を阻害するエンドポイントを、たとえ物理的に管理できない場所にあるとしても監視すべきだと考えている
インサイト2
SREはプラットフォーム・エンジニアリングではないが、どちらも能力を開発する
44%の組織が「プラットフォームまたは能力別」のチーム構造を採用していると回答した
インサイト3
インシデントから学ぶことは普遍的なビジネスチャンスである
47%が、インシデント管理活動全体において、インシデントからの学習が最も改善の余地があると回答している
インサイト4
AIは人間の知性に取って代わることはない
「AIに取って代わられる」と感じている回答者は(僅か)4%で、53%がAIによって「仕事が楽になる」と回答した
インサイト5
サービスレベルに関しては、(中小企業では)知らぬが仏である
24%の組織が、過去12ヶ月間に契約上のサービスレベル合意に違反したことがある
インサイト6
単一の監視ツールですべてを行うことはできない(そして暗闇の中でそれらを束ねる)
66%の組織が、2~5種類の監視・観測ツールを使用している
インサイト7
効率はプライドの敵
63%の人が、自分の仕事に誇りを持つことが最も重要だと答えた

今年のトピックスは?

インサイトスナップショットを、付随するレンズと共に見てみましょう。
それぞれのインサイトと共にいくつかの考えを列挙していますが、実際にはどのインサイトでも考察することができます。

インサイト1:コントロールを失うことで、人間関係と学習の新たな機会が生まれる

インサイト1

このインサイトは、サードパーティプロバイダの利用が増加の一途をたどっていること、そして実務者がコントロールと可視性をどのように見直しているかについてまとめたものです。
アンケートでは、実務者はこのようなものを監視すべきかどうかを尋ねましたが、答えは「はい」(64%)が大半を占めました。

ちょっとした逸話を紹介すると、Kurtと私が(コミュニティから多くの繰り返しやフィードバックを受けながら)アンケートを書いた、「複数当事者のジレンマを受け入れる:企業の垣根を越えたインシデントから学ぶ」というタイトルの動画Sarah Butt氏Alex Elman氏が出演)が共有されました。
組織の壁を越えて、人間関係を広げ、インシデントから学ぶことが、私以外にも関心を持たれているとは知りませんでした。

このインサイトを読む際には、自分のものを可視化することの重要性と傾向について考えてみてください。
そして、他のものを可視化する方法を考え直してみてください。

インサイト2:SREはプラットフォーム・エンジニアリングではないが、どちらも能力を開発する

インサイト2

このインサイトは、最初のインサイトの延長線上にあるものです。
また、エンジニアリングをより良いものにしようとする他の形態も取り上げています。
今年のレポートでは、プラットフォーム・エンジニアリングについて触れていますが、肩書きや呼称は仕事ほど重要ではないことを強調しようと努めました。

このインサイトを読む際には、あなたやあなたの会社の歩みを考えてみてください。
例えば、会社の成長に伴い、役割やチーム構造はどのように変化してきましたか?
たとえ肩書きが SRE でなくても、あなたは信頼性に情熱を注いでいますか?

もしそうなら、それだけで十分ということです。

インサイト3:インシデントから学ぶことは普遍的なビジネスチャンスである

インサイト3

このインサイトは、LFIコミュニティから着想を得ています。
まず、実務者がどれだけの数のインシデント(ヒント:大量)を管理しなければならないかについて、ベースラインを確立します。
続いて、インシデントからよりよく学ぶための方法を探るのです。

このインサイトを読む際には、例えば企業規模などの他の要因によって、特定の機能(この場合はインシデントの管理)のために専門チームが使用される場所がどのように決まるかについて考えてみてください。
そして、インシデントから学ぶ(「LFI」)ことは普遍的な機会であり、会社の規模によって大きく傾向が変わるわけではなかったと考えてみてください。
この非相関性は、規模別に傾向がある場合よりも、間違いなく魅力的です!

インサイト4:AIは人間の知性に取って代わることはない

インサイト4

このインサイトは、今後のレポートの前年比ベンチマークデータとなるかもしれません。
私たちは、昨年に見られた生成AIの報道を無視することはできませんでした。
また、これは前年比のベースラインとなる質問を確立するのに十分な規模であると考えました。

このインサイトを読む際には、長年にわたる他の進化について考えてみてください。
それらは失敗だったのでしょうか、それとも大成功だったのでしょうか?
クラウドへの移行、iPhone(ごめん、ブラックベリー)、ビットコイン、メタバースについて初めて耳にしたときのことを思い出してください。

新世代のAIはどうなるのか?
それを受け入れる準備はできているのか?
それとも葬り去るのでしょうか?

インサイト5:サービスレベルに関しては、(中小企業では)知らぬが仏である

インサイト5

このインサイトではサービスレベル違反について紹介していますが、より大きなインサイトでは、SREにおけるサービスレベル指標とサービスレベル目標の重要性について論じています。
また、両者の関係についても論じています。

このインサイトを読む際には、あなたの日々の責任を考えてみてください。
そして、これらの責任を、価値の流れを通して、エンドユーザの経験やビジネスの成果に至るまでマッピングできるかどうか、クリティカル・シンキング・エクササイズを行ってみてください。
自分のしている仕事が、自分、自分のチーム、自分のビジネスにどのような影響を与えるかを知ることは、それがどのように結びついているかをよりよく理解するために重要です。

インサイト6:単一の監視ツールですべてを行うことはできない(そして暗闇の中でそれらを束ねる)

インサイト6

これは今年のレポートの中で私が最も気に入っているインサイトです。
私たちは意図的にマーケティングのレトリックに反する方法を探しているわけではありませんが、時には紙の上の言葉がそのようになることもあります。
このインサイトは、「あなたの(監視ツールの)ニーズをすべて私たち(1つのプロバイダー)に集約しましょう」という純粋な魔法のメッセージに対抗するためのものです。

このインサイトを書いたのは、(いくつかのデータに裏打ちされた)ツールの使い方にアプローチするための、代替的で実際的な提案をするためです。
つまり、もしその組み合わせがコスト(コストには様々な形がある)よりも受け取る価値の方が大きければ、目的をもって複数のツールを使用することです。

このインサイトを読む際には、朝起きて「スタックにツールが足りないから、(単に追加するために)もっとツールを追加する必要がある」と言う人は(おそらく)いないことを考えていただきたいです。
逆に言えば、「(単にツールの数を減らしたというだけの理由で)ツールが多すぎるので、スタックからツールを削除する必要がある」と言い出す人はいないはずです。

インサイト7:効率はプライドの敵

インサイト7

私たちは、人間的、社会的な要素を取り入れるためにこのインサイトを書きました。
このインサイトには、Googleの代表的なレコメンデーションに対する私たちの有名なベンチマークデータも含まれています。

このインサイトにて「あなたにとって最も重要なことはどれですか」と尋ねたところ、「自分の仕事に誇りを持つこと」が1位(63%)だったことを嬉しく思っています。
残念ながら(あるいは幸いにも?)、組織のランクが上がるにつれて、効率的であることがより重要になっていきました。

このインサイトを読む際には、SREレポートを作成するためにどれだけの労力が必要であるかをご理解ください。
システムの信頼性とレジリエンスを確保するために膨大な量の作業が必要なのと同じように、外から見ている人は、それが本当に必要なことなのか理解できないかもしれません。

このような意味で、「本業以上の仕事」をこなしてくれた今年のレポート寄稿者に、この場を借りてお礼を申し上げたいと思います。
また、今年のレポートに寄稿したいと答えた(しかし、寄稿枠が足りなかった)アンケート回答者にも感謝します。

そして最後に、(レポート掲載順に)心からお礼を申し上げます。