SRE
- SRE
- 500万円 〜
最終更新日:
仕事内容
■ミッション
エムスリーのインフラストラクチャー全体の生産性・可用性・コストパフォーマンスを向上することで、各サービスの価値提供を促進する。
■担当事業・プロダクト
社内には多くの事業、サー
開発環境
環境: AWS / オンプレミス / GCP
OS: Linux
仮想化・コンテナ技術: ECS / Docker Swarm / KVM / Kubernetes
DB: 主に PostgreSQL / 一部で Oracle / MySQL
KVS: Redis / Memcached
監視: CloudWatch / Grafana / Datadog / Prometheus / Nagios / Kibana / Fluentd
構成管理: Terraform / Ansible / CDK
■チーム体制
●コアSRE
弊社の成長し続ける事業は数百ものマイクロサービスによって支えられています。SREチーム (2022/07 現在 6 名) のメンバーはコアSREと呼ばれ全社的にそれらの開発・構築・運用を支える存在です。垂直分業はしておらず、各自が自走するプロフェッショナルとして本質的な課題を解決することが期待されます。構築・運用フェーズといったロールでの分離はなく、課題に対するアプローチの考案から実装・実現まで各自が担います。プロダクト課題やSRE発の課題を解決する上で、各プロダクトの開発チームと協業することも日常的にあります。
●チームSRE
各サービス開発チームのメンバーとして参画し、そのサービスに特化したSREとして、サービスの信頼性に責任を持ちます。チームの他のメンバーと協力し、バックエンド、インフラを中心にObservabilityの改善や、応答速度向上のためのボトルネックの発見 / 解消、既存サービスのクラウド化など、非機能全般の改善に取り組みます。
求めるスキル
必須スキル/経験
・AWSまたはGCPの基礎知識
・Terraform および Ansible によるインフラ構築・運用経験
・パフォーマンス改善のためのボトルネック把握及びチューニングの経験
・いずれかのプログラム言語に対する基本的な読み書きとトラブルシュート能力
・クラウドまたはオンプレミス環境にてアプリケーションをデプロイ・運用・監視した経験
・Linux / Docker いずれもセットアップ・運用・課題解決できる能力
・基本的な問題発生時の解決能力
なお、選考プロセスにおいてプログラミング能力を確認することがあります。
歓迎スキル/経験
・AWS / GCP におけるマルチアカウント・マルチクラウド環境の整備・運用経験
・Linux / 言語処理系レベルのトラブルシュート能力
・ネットワーク(VLAN / 動的ルーティング)の構築・運用経験
・オンプレミスのハードウエアや KVM の運用経験
・PostgreSQL の高可用性構成の構築および無停止での DB 移行の実践経験
・Web サービスの SLI / SLO の定義および監視運用の実経験
求める人物像
-
紹介資料
仕事の魅力
■得られる経験・スキル
・大規模なマイクロサービス環境における実践的な構築・運用・改善の経験・実績
・AWS / オンプレミス / GCP のマルチクラウド環境に対する知見・スキル
・売上・機能規模の大きいサービスのオンプレミス → クラウド移行の経験