【#も読】The Future of Site Reliability: Integrating Generative AI into SRE Practices(@isaoshimizu)のトップ画像

【#も読】The Future of Site Reliability: Integrating Generative AI into SRE Practices(@isaoshimizu)

投稿日時:
清水 勲のアイコン

株式会社MIXI / みてね事業本部 みてねプラットフォーム部 部長

清水 勲

Xアカウントリンク

「あの人も読んでる」略して「も読」。さまざまな寄稿者が最近気になった情報や話題をシェアする企画です。他のテックな人たちがどんな情報を追っているのか、ちょっと覗いてみませんか?


はじめまして。今回から興味を持った書籍や記事などについて定期的に #も読 という形で紹介をしていきたいと思います。

SREと生成AI

いまの世の中、生成AIの話題だらけですが、SREの世界に生成AIをどう適用していくかというのは興味深いテーマです。

2024年に公開された「The Future of Site Reliability: Integrating Generative AI into SRE」という論文をネットで見つけ、その内容が興味深かったので今回紹介したいと思います。この論文の著者のSubash Banalaという方はCapgeminiというIT企業でSREや生成AIの実践をされている方のようです。

論文では、生成AIを適用してSREに役立つ「障害の予測」「インシデント対応」「リソース管理」について、具体的にどのように生成AIを活用できるかを考察していました。それぞれのテーマについて私なりの感想と考えを書いてみたいと思います。

障害の予測

障害が起きる前に予兆に気づければ、障害を未然に防ぐことができるかもしれません。人間がリアルタイムに予兆に気づくのは難しいですが、生成AIを使うことで、過去のデータから障害の予兆を学習し、リアルタイムで監視することが可能になります。これにより、障害が発生する前にアラートを出すことができるようになります。ログ、メトリクス、システムアラートといった大量のデータを生成AIが分析し、ダウンタイムを発生させる前に異常を検知することができます。

人間がメトリクスのグラフやログを確認してエラー数の増加に気づき、対応することもありますが、その時点ですでに障害が発生していることが多いです(私の経験上も)。しかも、障害が発生してからそれなりの時間が経過していることが普通で、これを生成AIによって影響が軽微なうちに検知できるようになると、障害の影響を最小限のうちに解決できるようになりそうです。

インシデント対応

すべての障害を未然に防げることに越したことはありませんが、恐らくそんなことはないでしょう。もし障害が発生した場合、生成AIに現状を分析できるデータを与えられれば、根本的な原因を素早く特定できるかもしれません。生成AIをうまく活用することで、過去のインシデントのデータを学習し、類似のインシデントを特定し、解決方法をさっと導くことができます。これにより、インシデントの解決時間(MTTR)を短縮することができるかもしれません。

また、ポストモーテムの作成も生成AIに任せることができるかもしれません。ポストモーテムは、インシデントの原因を特定し、再発防止策を考えるために重要なものですが、これを人間が行うのはある程度時間もかかりますし、作成者によって内容の偏りが起きる可能性もあります。生成AIで、インシデントの詳細を分析し、ポストモーテムを自動的に生成できると非常に便利です。

リソース管理

SREの役割の一つとしてキャパシティプランニングは非常に重要です。信頼性とコストのバランスを考えながら、リソースを適切に管理する必要があります。生成AIは、過去のデータを分析し、将来のリソース需要を予測することができます。これにより、リソースの過剰供給や不足を防ぎ、信頼性を維持しながらコストを最適化することができるかもしれません。

しかし、生成AIは必ずしも良い精度の予測ができないかもしれず、その結果信頼性を損なう可能性もあり、扱いには注意が必要でしょう。ただ、キャパシティプランニングは経験や勘に頼り、職人化しやすい部分があるため、生成AIを活用することで、よりデータに基づいた意思決定ができるようになるかもしれません。

まとめ

論文では生成AIを活用したことによって得られた効果を定量的にレポートしています。より詳細な内容を知りたい方は、ぜひ論文を読んでみてください。生成AIはSREの世界においても非常に大きな可能性を秘めていると思います。今後、生成AIがSREの実践にどのように適用されていくのか、非常に楽しみです。

プロフィール