複数の国内No.1プロダクトを横断し、至高のSREを目指すリーダーのシコウ ~ 個の力とチームの力を同時に信じる信頼性エンジニアリング ~
河合俊典 : 業務執行役員 VPoE (インタビュアー)
主にエンジニア組織の組織マネジメントに従事
国内数名のGoogle Developer Experts (AI/ML)認定エンジニア
最近良いと思ったアニメは「メダリスト」
後藤祥 : SREチーム ゼネラルマネージャー
製薬企業向けプロダクトのSREを経て、コアSREチームとして
各チームの支援や共通インフラの管理を担当 アラートへのレスポンスの速さは社内でもトップクラスと自負
横本大輔 : SREチーム ゼネラルマネージャー
SREチームやセキュリティチームのゼネラルマネージャーを兼任するなど
エムスリーの裏側を広く深く技術で支えるマネージャー
体内時計のTZはUTC
エムスリー SREチームの多様なリーダーシップ
河合:SREチームのリーダーのお二人にインタビューということで、今日はよろしくお願いします。横本さんは、以前「基盤チームTL対談」で横本さんには自己紹介して頂いたので、後藤さんのバックグラウンドを教えてもらっても良いですか?
後藤:最近ゼネラルマネージャーになりました、後藤です。
前職は日鉄ソリューションズというSIerで開発をしていました。よくある「マネジメントに進まず技術者として働いていきたい」という動機で転職活動をしていた時にエムスリーと出会い、「面接での技術質問の良さ」や「企業規模に対して人数が少なくギーク」な側面に触れてエムスリーに入社しています。
エムスリーは7年目。元々はUnit1というチームのチームSREをしていました。OracleリプレイスやAWS環境へのリアーキテクチャといった大きめのプロジェクトをいくつか経験した後、コアSREに軸足を移し、チームリーダーを経てゼネラルマネージャーとなりました。
チームリーダーやゼネラルマネージャーと聞くとマネジメントの毛色を強く感じるかもしれないですが、私はどちらかというとテックリードのような働き方なのでBatch移行だったりDBテーブルを更新したりと最近も手を動かしています。エムスリーのリーダーは、意思決定をする人という意味では共通ですが、成果の出し方は多様であって良い側面があり楽しくやれています。
河合:やりたいことが出来ていそうで、VPoEの私は嬉しいです!横本さんも後藤さんと同じくテックリード的な働き方が得意ですよね。
横本:そうですね。大きな成果が出るならやり方は任せられている、というのはゼネラルマネージャーだろうがメンバーだろうが変わらないのがエムスリーだなと思います。SREにおける「解決策」なんて無数にありますからね。それを思考して試行できる環境だと思います。
河合:つまり至高の環境ってことですね、シコウだけに(笑)
SREチームのしごと
河合:「エムスリーのSREチームって何やってるの?」という人が多いのかなと思っています。具体的な仕事の話を聞かせてもらえますか?
後藤:これを一言で表現するのがいつも難しいんですよね(笑)
まず、エンジニアリンググループの中でも随一広い技術範囲だと思います。扱うインフラはAWS/GCPを中心にオンプレミスも一部あります。それらを管理するためにTerraformやAnsibleといったIaCも当たり前に利用しています。DataDogやOpenTelemetryのような監視の整備、各チームで扱っているECSやKubernetesのようなインフラ、コードを触ることもありますし、GitLab/GitHubなど基幹ツールの管理、セキュリティ施策やDevOpsなどもSREチームのターゲットです。
国内導入数No.1の電子カルテ「デジカル」や病院の待ち時間を0にする病院DXアプリ「デジスマ」といった、toC/toB両軸で幅広くグローバルな開発基盤を一手に担っています。
横本:具体的ですが、データセンターに一緒に行ったりもしましたよね。私はクラウド経験は長いですが、本番サーバのケーブルを抜いたのはエムスリーが初でした(笑)
河合:私は人生で何度か居合わせたことがありますが、物理で本番サーバを触るのは何度経験してもドキドキするのでよく分かります…!
後藤:強調すべき特徴があるとすると、エムスリーには、事業やユーザにとって最適な技術を都度選択していくカルチャーがあるので、SREチームはそのカルチャーを支える仕事をしています。それぞれのタスクで、最も良い意思決定ができるよう、日々研鑽してますね。
河合:かなりタスクの幅が広い中で、どうやってタスクの優先順位を決めてるんですか?
後藤:エムスリーのROIカルチャーを踏襲しています。
たとえば監視の仕組みであれば、その監視によって調査がどの程度うまく進むようになるのか、障害復旧速度の向上幅、開発工数などを算出して決裁を取るようにしています。エムスリーは全社的にROIカルチャーで動いているのでSREチームの優先順位付けとしても納得感がありますし、ROIの面で説明が通っていれば技術面で柔軟かつ実利に基づいたチャレンジができるというロジックです。
横本:直接役員に説明してフィードバックももらうので、一般的に難しいとされているSRE関連のタスクのROI算出を経営視点から調整できるようになっていくのは、エムスリーのSREチームの魅力だと私も思います。そうすると、技術選定についても事業の未来を見据えた選定が可能になりますし、意思決定の精度が上がっていきます。
個人的には、職能の広いSREにとって重要なことだとも思っています。目の前の開発タスクをやることの価値、やらないことの価値が適切に判断できなければ、次第に増える日々のタスクに追われて事業に伴走できなくなってしまうので。
河合:技術が広いから優先順位が必要という流れではなく、ROIカルチャーでしっかり説明されるからこそ技術の幅が柔軟かつ適切に広くなる、という矢印なんですね。他のチーム同様『組織的な技術選定』ではなく『その事業にとって最も価値を生み出せる技術選定』に重きを置いていることも改めて認識出来ました。ありがとうございます。
SREチームの開発スタイル
河合:SREチームでは、ROIカルチャー以外に大事にしているスタイルはありますか?
後藤:なるべくマイクロマネジメントをしないようにしています。不要に管理はしないが、必要十分に協力する。むしろ集中して手を動かす時間を確保してもらうことを意識しています。
個人のスペシャリティも多様ですし、大手クラウドベンダーからメガベンチャー、SIer、スタートアップ、GAFAMのようなビッグテックで働いてきた様々な人がSREとして活動しています。バックグラウンドによっても開発で必要になる知識が変わってくると思っているので、特定のプロダクトの知識は自ら手を動かして取り込むスタイルが中心です。属人性は高まりますが、ROIが高いのであれば一定の属人性を許容しているとも言えます。
横本:補足すると、デイリーで毎日互いのチケットを確認していたり、チーム単位での依頼を比重付きランダムアサインで振り分けるといったことをしています。また、普段はリモートワークが中心ですが、たまにオフィスに集まって一緒に負債解消デーを実施したり、全体の知識共有会を実施しています。なので、多くのメンバーが共通で触れられる範囲が広く重なっているのですが、「全員が全てを知っていなければならない」という絶対的なルールは制約として大きすぎるので敷いていないというイメージです。
河合:技術知識や専門性の尊重は、1プロダクトではなく多数のプロダクトを横断的に見るエムスリーSREチームならではとも言えそうですね。
SREチームのこれから
河合:SREチームとして今取り組んでいる課題や今後やっていきたいことはありますか?
後藤:クリティカルユーザージャーニーを実現していく活動が増えてきています。
例えば、m3.com(医師の9割が登録する医療情報プラットフォーム)は内部的にはマイクロサービスですが、ユーザ視点では1つのプロダクトです。他にも医療という分野をより良いものにするためのプロダクト間接続が増えてきています。
ユーザ視点で見た時にサービスが一体どういう状態なのか横断的に監視したり、体験を改善していくことが今のチャレンジです。高い信頼性が求められる医療業界で、クラウド障害も乗り越えるレベルで在り続けたいと考えているので、日々改善を推進しています。
横本:最近で言えば、AI時代に向けたAI SRE活動も増えてきましたね。エムスリーではほぼ全エンジニアが日常的にAIを使っている状況ですが、MCPやコード検索、AIを使ったCIテンプレートなど、共通で使える所をSREが整備したりしています。
横本:SREチームもこれから170社を超えるエムスリーグループ全体がターゲットになっていくと思うと、今後AIによって起きうる様々な課題や動きに対応できるようにしておくのが重要だと思っています。サーバメンテナンスでも利用していくなど、AI活用の旗を振るだけではなく、種を蒔く側になっていきたいです。
河合:楽しみですね。サービスの信頼性はもちろん、AIにおける信頼性も一緒に作っていきたいですね。
おわりに
河合:最後に、エムスリーSREチームに来て欲しい人、その人に向けたメッセージをもらえますか?
後藤:大規模サービスから毎年数個の新規開発まで多数のプロダクトを見ているチームで、SREとして技術の幅を広げたい人、手を動かしたい人にはうってつけの環境だと思います。知らない技術を学んで、よりその技術を活かす方法を考えるのが好きな人に来て欲しいです!
横本:とにかくギークな人に来て欲しいです。お家Kubernetesクラスタの話をしたり、新しいOSの話をしたり、ネットワークやセキュリティの話で盛り上がりながら、一緒に仕事を進められると嬉しいなと思っています。
河合:私もラズパイクラスタの話は好きなので、その話する時は混ぜてください(笑)
本日はありがとうございました!
【SREチームの紹介はこちらから!】
- SREチーム 紹介資料
- SREチーム 募集要項
- SREチームメンバーが書いたオススメ技術記事
アットホームな職場です。皆様と技術トークでワイワイ出来る日を心待ちにしています。