クリスマスに欲しいのは、回復力のあるインターネット!
全てを叶えてくれるサンタクロースは……?
2022年12月22日
翻訳: 島田 麻里子
この記事は米Catchpoint Systems社のブログ記事 All I Want for Christmas is a Resilient Internet!の翻訳です。
Spelldataは、Catchpointの日本代理店です。
この記事は、Catchpoint Systemsの許可を得て、翻訳しています。
拝啓 サンタさん
私は今年、とっても優秀なITオペレーションズ・マネージャーでした。
(今の世相を考えると、これは大袈裟かもしれませんけど)
それで、私の欲しいものリストが何点かあるんです。
障害をなくして!
もちろん、多種多様な理由で障害は起こるので、無理な要求であることは分かっています。
今や誰もがインターネットを企業ネットワークとして利用するようになったし、クラウドサービス、CDN、SaaSアプリケーション、BGPやDNSなどのシステムが相互に接続され、ますます複雑化している中で、どのトラフィックも目的地に到達するのはちょっとした奇跡と言えるでしょう。
でも、もしかしたら障害が少なくなるかも?
そしてエンドユーザへの影響が本当に小さいものにはならないかな?
世界中の何百万人ものITOps/NetOps担当者やSREが、物事を動かし続けるために一生懸命働いているのは知っていますが(だから彼らにも気の利いたプレゼントをあげてください!)、深刻な障害が起こり続け、そのコストはますます高くなっています。
北極にいるサンタさんのインターネット・プロバイダがどこかは知りませんが、カナダ人であれば、この夏、ロジャーズ・コミュニケーションズが3日以上にわたってダウンしたとき、きっとお気づきになったことでしょう。
もし機会があれば、彼らのネットワーク設計者の何人かへ、靴下に入ったいくつかの石炭をあげるといいかもしれませんね。
(訳注:アメリカでは、クリスマスにお利口じゃなかった子供には、靴下の中にプレゼントではなく暖炉の中のCoal(石炭)を入れられてしまうと言われています)
それから、ついでに……
ヘルプデスクチケットを大幅に減らして!
サンタさん、いい子にしてたって言ったけど、正直に言うと、どうしても閉じられないチケットがあります。
パスワードの再設定やソフトウェアの更新とか、簡単なものは吹雪のようにやってきて、そこから掘り起こすのに一日中かかってしまうんです。
私のユーザ(物知りなユーザとお馬鹿さんなユーザ)が問題のほとんどをセルフサービスで解決できるような方法があれば、本当に助かるのですが。
そうすれば、チケットの枚数は少なくとも半分に減るんです。
あとは、接続やルーティングなどの断続的なエラーによって、私は残り少ない髪の毛を引き抜いていますよ!
もし、ユーザのノートパソコンからアプリケーションまでの往復を追跡する簡単な方法があれば、数時間以内にこれらの問題を解決することができるのですが……。
その代わり、私のチームは、互いに連携していないほぼ1ダースの異なるツールを使って、問題を突き止めるのに苦労しています。
さらに悪いことに、私の組織では、影響を受けるシステムの半分を異なる人が所有していて、IT担当者が何かに合意するよりも、牧羊「猫」でも育てる方が簡単なのです。
これ以上、私たちのせいではない何かを私たちのチームのせいにしようとする幹部たちの争いに何日も巻き込まれたら、そろそろ本気でスパイス入りのエッグノッグを飲まなければならなくなりそうです。
(訳注:エッグノッグはクリスマスによく飲まれる牛乳ベースの甘い飲み物。さらにスパイスを効かせてホリデーまで働かねばならない、ということ)
あと、そういえば……
より包括的なRUMとWeb体験分析を!
RUM(Real User Monitaring)は、ネットワークの品質を評価し、ユーザがWebサイトに到達できない理由を理解するための、私の最も強力なツールです。
私のWebサイトのパフォーマンスや体験監視と同じツールで、より多くのことができるようになれば最高です。
理想は、実際のユーザが影響を受ける前に、RUMを使ってWebの問題をアラートできるようにすること―これはITの聖杯です(休日の比喩を混ぜてもよければ)。
(訳注:ここでいう聖杯は、非常に高く手が届かない所にあるものという意味)
訪問者(とお金)を失う前に、パフォーマンスの低下を知らせてくれる「Webサイト体験」ゲージを1つ備えたダッシュボードが欲しいですね。
実は、いま計測のことを考えると……
詳細データの過去と現在の亡霊たち!
もしチャールズ・ディケンズのクリスマスの亡霊のうち誰かをご存じでしたら、私までご紹介ください。
(ただし、過去と現在だけで。未来の亡霊はそんなにコミュニケーション能力が高くないことはわかってます。)
(訳注:チャールズ・ディケンズ著「クリスマス・キャロル」には過去・現在・未来の亡霊がそれぞれ登場します)
私は、ネットワークのパフォーマンス、アプリケーション、Webサイト、ユーザ(社内外)の体験について、より詳細できめ細かいデータを常に必要としています。
悪魔は文字通り細部に宿るもので、データポイント同士の間隔が長いと、ネットワークの問題を診断するのが本当に難しいことがよくあります。
また、今何が起こったかを見ることはできるし、先週何が起こったかを見ることもできますが、通常はそれくらいです。
昨年、あるいは2年前の参考データを引き出して、現在の測定値を照らし合わせることができれば最高なのですが。
そうすれば、問題を素早く見つけて修正することが容易になるだけでなく、ここ数週間、数ヶ月、数年の間に当社のインターネットパフォーマンスがどれだけ向上したかを上司にアピールすることができます。
そして、現在のデータの亡霊といえば……
BGPのリアルタイムデータ!
あなたが一晩で世界中の家を回れるなら、私のBGPデータをリアルタイムにすることができるでしょうか?
BGPエラーはよくあることで、本当に困ったものです。
この技術はセキュリティのために設計されたものではありませんが、BGPハイジャックが起こるたびに、私の(潜在的に重要な)データはどこへ行ってしまうのかとパニックになりますよ!
結局、よくて5分前、悪くて15分前のBGP監視データを扱いながら、それを解明しようとすることになります。
つまり、不具合の修正はおろか、診断だけで1時間以上かかってしまうこともあるのです。
様々なBGPソースをリアルタイムで見ることができれば、BGPリーク、ハイジャック、ルートエラーをより迅速に修正することができるようになるでしょう。
そこで、次のお願いなのですが……
可観測性あるバンテージポイントを増やして!
そりから見える景色は素晴らしいのでしょうが、私の見晴らしの良い場所はもっと限られているのです。
私は世界中に顧客や同僚がいますが、彼らがいる場所からネットワークを監視できることはめったにありません。
確かに、社員がオフィスにいたり、ユーザが欧米の主要都市にいたりすれば、ネットワークの問題は簡単に解決できます。
しかし、私が観測できないような場所からネットワークにアクセスするユーザがいるのです。
そのアカウント・マネージャーの接続問題は、彼のノートパソコン、彼のWi-Fi、彼が座っているアンカラ空港のWi-Fiネットワーク、あるいはトルコのローカルISPのせいなのでしょうか?
トルコにテスト用のノードがあれば、もっと早く解決できるのに!
私は数百のパブリックノードとエンタープライズノードにアクセスできますが、自分の仕事をきちんとこなし、ユーザを幸せにするためには、本当は数千のノードが必要なのです。
そして、人を幸せにするといえば……
お助け妖精もいてほしい!
サンタさんのおもちゃ工場にいる妖精たちに、しばらくの間、私を助けてもらうことはできないでしょうか?
他のITチームと同様、私たちは人手不足で、ベンダーのサポートはかなり当たり外れがあります(率直に言って、ほとんどのベンダーからのサポートは「外れ」です)。
もし妖精たちがPlayStationやiPadを作ることができるのなら、私が毎日使っている複雑な観測・監視ツールの技術サポートもやってくれるのではありませんか?
私は、ダッシュボードやテストの設定に関する質問への回答や専門家によるアドバイスが本当に必要なのですが、時折その助けを得ることができず、とても困っています。
レスポンシブルで知識豊富なサポートがあるなら、乳香や没薬はもちろんのこと、黄金にも換えがたい価値があります!
(訳注:イエス・キリストが誕生した夜、星に導かれてやってきた学者たちが持ってきた贈り物が、黄金、乳香、没薬)
サンタさん、私が今年本当にお願いしたいのは、信頼できる、安定した、回復力のあるインターネットなんです。
私は日々、ユーザの皆さんにそれを提供しようと努めていますが、サンタさんからのプレゼントがあれば、それがもっと簡単になるはずです。
それとも、Catchpointをツリーの下に置いておいてくれるかな。
そりゃすごいことだ!
敬具
世界中のITOps、NetOps、SREに携わる全ての人へ
2023年、インターネット・レジリエンスのために、あなたがサンタさんにお願いしたいことは何ですか……?