当社が提供するサービスの事業部に所属し、その事業がユーザへ提供する価値をSite Reliablity Engineeringを用いて最大化するSREチームをマネージします。
SREはSLOを基準に品質と開発スピードをコントロールし、ビジネスの成長に合わせてプロダクトを運用可能に保つことで信頼性を担保します。
プロダクト開発組織はLeSS Hugeのフレームワークを使用して開発しています。各チームの最大限の力を発揮するためには、プロダクトや組織の改善が重要です。SREチームがより効果的に動けるようにサポートしていけるエンジニアリングマネージャーを探しています。
SREチームのマネージャーはマイクロマネージメントはせずにチームの自己組織化、自律した成長を促進することが期待され、SREチームがSite Reliablity Engineeringを実践できるようにチームや開発組織を動機付けます。
【具体的な仕事内容】
- チームメンバーが行うこと
- モニタリング基盤の整備
- SLOの設定とエラーバジェットの運用
- トイルの撲滅、自動化
- ポストモーテムの運用
- インフラ、運用的なセキュリティ対策
- アーキテクチャのレビュー、改善、単純化
- 本番・開発環境の運用を他開発チームと協働する
- インフラ構築を他開発チームと協働する
- CSやセールス等との協働
- チームと共に行うこと
- チームミッション・ビジョン策定
- チーム目標設定
- メンバーの目標設定
- チームやプロダクト開発組織、プロダクト、技術を含めたあらゆる課題の発見と改善の手伝い
- 各スクラムイベント
- チームやメンバー、事業のために行うこと
- チームの長期的戦略の立案
- 1 on 1 やコーチングの実施
- メンバーの心理的安全性の確保
- 他部門・他職種・部門長・事業長・経営陣との調整、コミュニケーションの仕組みづくり
- 組織施策の立案・運用
- チームメンバーの評価
【応募資格】
必須
・SREとしての経験もしくはソフトウェアエンジニアとしての経験
・SREの思想、原則の理解
・アジャイル(特にスクラム開発)の経験
・エンジニアチームでのマネジメント経験
・エンジニア組織の改善経験またはその能力を有していること
・SREチームの活動を通してビジネスに貢献したいという意志がある
・パブリッククラウド上に構築されたサービスにおける全般的な知識
歓迎
・AWSの運用経験
・GCPの運用経験
・セキュリティに関する深い知見
・ソフトウエアエンジニアとして業務としてのアプリケーションの開発経験
・標準的なTCP / IPネットワーキングとDNSやHTTPなどの一般的なプロトコルの理解
・AWS、GCP、Microsoft Azureなどのクラウドサービスの基礎的知識
・Dockerベースのコンテナに関する業務経験
・コーチングの経験
・スクラムマスター、POの経験
・組織のミッション・ビジョン・戦略の策定経験
【主な技術スタック】
[AWS] EC2, ECS, EKS, SQS, SNS, Lambda, S3, Cloud Front, Batch, Secrets Manager, RDS, Elasticashe, Parameter Store, DynamoDB, Trusted Advisor, Route53, kinesis
[GCP] BigQuery, GKE
[仮想化基盤] Docker
[OS] AmazonLinux, Alpine, Debian
[ミドルウェア] Nginx, MySQL, Spring Framework , Aurora
[プロビジョニング] Terraform
[監視] Datadog
[開発環境] Mac, Github, GitHubEnterprise, JIRA, Confluence, Jenkins, Slack
[使用言語] Scala, Typescript, NodeJS, Python, Go, bash