1
/
5

【社員インタビュー】守備範囲を広げ、突破する思考で障害対応、アラート削減を行っています

インフラストラクチャ部のシニアリードエンジニアとして、CDN・HTTP関連の業務や、キャパシティプランニングおよびサイジング、障害対応、障害を減らす取り組みなど幅広い業務に携わっています。
グリーが急速に発展していた頃に声が掛かり、外から見て「拡張スピードに見合う対応が追いついていないだろう。つまり“問題が多そう” だから“楽しそう”。」と思って入社しました。そのため入社直後から早速、障害を減らす業務に取り掛かりました。このポジションのやりがいとしては、比較的成果が分かりやすいことが挙げられますが、その指標の一つが夜間障害の件数です。とある障害に対しては、深夜対応を減らすための問題つぶしを実行して、実質的には半分以下に減らすことが出来ました。日常的にもアラートが増えてきた場合には、カッチリしたプロジェクトチームというより、サークル的な感じでアラートを減らすミーティングを重ねて対策を取っています。というのも、チーム全体の雰囲気が“ゆるふわ”なんですね。上下や横のつながりがフラットで軽い一方で、エンジニアそれぞれの専門性が高く、自分の領域の課題に対しては、必ず最後まで面倒を見るという姿勢で臨んでいます。

インフラ部門で他社と違って珍しいと思うのは、多くのインフラエンジニアがコードを書けて、レビューも行える点です。SREが浸透してきていますが、それ以前から社内ではインフラエンジニアが、サービス側のコードを解析して修正提案を行ったりしていました。中には、プロダクト開発側で人手が足りない時にサポートに入る人もいるほどです。それぞれが多様なキャリアを積んで、技術の守備範囲を広げています。個人的には最近は社外のシステムも見ることも多く、システムエンジニア的な動きも求められていると感じています。



『シノアリス』のリリース時のことは印象に残っています。担当ではなかったのですが「監視画面ぐらい見とこうかな」と開いた瞬間から緊急対応が発生して一週間ほど張り付きましたが、無事に突破することができました。これはひとえに、部門を問わずに、様々なメンバーを集められる層の厚さと、フラットに会話しながら協力できる文化があったおかげだと思います。このようにイレギュラーな対応が発生した際、インフラエンジニアは正論にとらわれず、臨機応変な対応を求められます。最終的には本来の正攻法に戻して、緊急対応の不備をならすことも重要だと思います。

今後は、セキュリティの知識を身につけて何か問題が起きたときに対応できるようになりたいです。また、OSS活動での貢献もしていきたいと考えています。

Invitation from グリー株式会社
If this story triggered your interest, have a chat with the team?
グリー株式会社's job postings

Weekly ranking

Show other rankings
Like 穴井 晋太's Story
Let 穴井 晋太's company know you're interested in their content