BASEのSREグループでは、成長するサービスを支えていくために、
「信頼性=ユーザの期待値を超え続けること」を維持し続ける!
を掲げ、日々以下のような業務に取り組んでいます。
■業務内容
・AWSを用いたインフラ基盤の方針策定、設計、実装、運用
・パフォーマンスの改善、およびトラブルシューティング
・ソフトウェア・エンジニアリングによるトイル削減、サービスの運用効率化
・モニタリング、アラートシステムの構築、運用
・プロダクト開発者自身でのシステム運用をサポートする関連ツールの構築、運用
・サービス障害やメンテナンスへの対応
■募集背景
新型コロナにおける2020年の緊急事態宣言下において「BASE」の利用者様が急増しました。
その際の状況について、以下の弊社CTO川口の記事に書かれているようなことが改めて課題として浮き彫りになりました。
「もうさばき切れない」アクセスが激増したECプラットフォームにおける負荷対策
https://devblog.thebase.in/entry/bsucon
これ以外にも、例えば、
・よりプロダクトに寄り添ったSLI/SLOの策定、展開、運用
・推測が難しい高トラフィックへのスケール (メディア露出など)
・プロダクト開発者自身もパフォーマンス課題を把握し、改善につなげられる仕組みや体制
・長期運用によって溜まったトイルなどによる運用コストの増加
・組織やサービス拡大によって増加していくインフラ面での多様な設計検討や構築
・不具合や障害を予防するためのQAや負荷テスト環境
といった課題があります。
当SREグループはSREの思想を可能なところから徐々に取り入れ始めたばかりのまだまだこれからのグループです。
一緒にSREグループを形成しながら、これらの課題を1つ1つ改善し、サービスの成長を支えていってくれる方を募集しています。
■必須スキル
・SREやインフラエンジニアとしてWebサービスの一定の運用経験がある
・AWSを利用した開発や設計/構築の知識、サービス運用経験がある
・24時間365日動いているWebサービスに携わるという意識と経験がある
これらのご経験や、SREの思想を持ちながらサービスの信頼性向上に対する意欲を重要視します。
■歓迎スキル
・AWS上での高負荷なサービスのパフォーマンスチューニングの経験
・Terraform等を利用したInfrastructure as Codeの実践、運用経験
・Ansible,Chef等を利用したサーバ構築、管理の経験
・Nginx,Apache,Memcached,Redisなどのミドルウェアの利用、運用経験
・Amazon AuroraやMySQL等の運用経験
・Akamai,CloudFrontなどCDNの利用経験
・Go,Ruby,Python,PHP等を用いた開発や運用自動化などの経験
・セキュリティに関する専門知識
・課題に対して技術的なアプローチで解決した経験
■求める人物像
・BASEのミッション「Payment to the People, Power to the People」に共感し、プロダクト成長のために課題解決を実行していける方
・3つの行動指針「Be Hopeful」「Move Fast」「Speak Openly」に沿ったご志向の方
・インターネットが好きで、Webサービスやアプリへの強い興味・関心がある方
・常に変わっていく状況を楽しみ、変化に柔軟に対応していける方
・オーナーズの成長や成功、関わるメンバーの成長や成功も喜べる方
・持っているスキル/経験を出し惜しみなく発揮しプロダクトを良くしていくために行動する方
・チーム間やメンバー間の情報共有を大切にしながら動く方
■開発環境
・インフラ: AWS (EC2/ECS/Fargate/S3/Lambda/SNS/SQS/API Gateway)
・Webサーバ: Nginx, Apache
・サーバOS: CentOS, Ubuntu
・DB: Amazon Aurora MySQL, Amazon Elasticache (Redis/Memcached)
・画像配信: Akamai, ImageFlux, S3
・CI/CDツール: CircleCI
・検索: Amazon CloudSearch / Amazon Elasticsearch
・モニタリング: Mackerel, New Relic One
・ソースコード管理: GitHub
・構成管理: Terraform, Chef, Packer