AIがコードを書く時、SREは信頼性をどう設計するか── クラウド/インフラ話題6選のトップ画像

AIがコードを書く時、SREは信頼性をどう設計するか── クラウド/インフラ話題6選

投稿日時:
馬場 俊彰のアイコン

株式会社X-Tech5 / 取締役CTO

馬場 俊彰

Xアカウントリンク
「あの人も読んでる」略して「も読」。さまざまな寄稿者が最近気になった情報や話題をシェアする企画です。他のテックな人たちがどんな情報を追っているのか、ちょっと覗いてみませんか?

こんにちは。馬場(netmarkjp:Bluesky/X)です。

わたしは「#ばばさん通信ダイジェスト」として、BlueskyやXに毎日少しずつ、賛否関わらず話題になった/なりそうなものを共有しています(Bluesky検索/X検索)。

これらをベースに、特にクラウド/インフラ/SRE/オブザーバビリティ/運用等のキーワードに関する話題を中心にお届けします。

Cloudflareの物理サーバー、第13世代目

Cloudflareがブログで、Gen 13(第13世代)の物理サーバーについて技術仕様を公開しました。

アプリケーションプログラムの書き直しと、新しいアプリケーションプログラムに合わせた基盤仕様の再考で、Gen 12比で2倍のスループットを達成したそうです。

スペックだけを見るとGen 12からGen 13ではCPUコア数が倍増しており、CPUコアあたりのL3キャッシュが大幅減しています。

しかしその上で動かすアプリケーションプログラム FL1を、Rustで書き直したFL2に更新したことでメモリー利用効率とメモリーアクセスパターンが効率化しました。結果としてメモリーの利用量とアクセス効率が大幅に向上し、L3キャッシュを減らしてCPUコア数を増やすほうがコスト効率が良くなったとのことです。

結果としてサーバーあたりのネットワーク帯域幅は、25Gbps ×2から100Gbps ×2と4倍増しています。

ソフトウェアとハードウェアが協調して最適化すると圧倒的に効率が良くなる好例です。

物理ハードウェアの話はワクワクしますね。

OpenTelemetryでの4つ目のシグナル対応

OpenTelemetryから、プロファイルがパブリックアルファに到達したことが発表されました。

オブザーバビリティのシグナルと言えばメトリクス・ログ・トレースですが、4つ目のシグナルとしてプロファイルが登場しています。

4つのシグナルを組み合わせることで、より具体的にシステムの挙動を知ることができるようにしようという流れです。

この記事のつづきを読もう
新規登録/ログインしたらできること
  • すべての記事を制限なく閲覧可能
  • 限定イベントに参加できます
  • GitHub連携でスキルを可視化
ログイン
アカウントをお持ちでない方はこちらから新規登録

あの人も読んでる

「あの人も読んでる」略して「も読」。さまざまな寄稿者が最近気になった情報や話題をシェアする連載企画です。