- ソフトウェアエンジニア
- プロジェクトマネージャー
- 新卒・事業開発・研究開発
- Other occupations (24)
- Development
- Business
- Other
アンドパッドのデータ基盤チームを率いる須貝将士さん。学生時代からデータ分析のためにPythonを使っており、新卒時からデータエンジニアとしてキャリアをスタートさせた稀有な存在です。前職のSaaS企業においても、データ基盤を構築するチームのテックリードとして活躍していました。
そんな須貝さんが、アンドパッドに転職して叶えたかったこととはなんだったのでしょうか? 入社後の新しいトライや、データエンジニアのやりがいなどもあわせて聞きました。
須貝 将士(すがい しょうじ)
学生時代に物理学や数学を学び、実験データの分析などを通じてデータエンジニアとしての素養を培う。アドテク系企業とSaaS企業でキャリアを重ねた後、2020年5月にアンドパットに入社。データ基盤チームの立ち上げを行う。データドリブン経営における意思決定をサポートする要として、ボードメンバーから頼られる存在。
効率性の高いデータ基盤をイチから構築したかった。
―ニーズは拡大しているものの、まだまだ希少なデータエンジニア。須貝さんの学生時代は、より一層珍しい存在だったと思います。どのような経緯でデータエンジニアリングに関心を持ったのでしょうか?
学生時代に物理学を専攻しており、Pythonを使って実験データの分析をしていたことがきっかけです。その経験を生かし、インターン先などでも、自動運転のアルゴリズムをつくるための運転データの解析をしていました。例えば、「地図上のどの時点でアクセルをどれだけ踏んで、ブレーキをかけて何秒で停止した」など運転者の傾向を分析していました。ただ分析するだけでなく、分析用のツールがそもそもなかったため、こちらも自分で作成していました。
そうした経験を踏まえ、データエンジニアリングはとても伸びしろのある分野だと実感していました。その道を深めたかったので、新卒時からデータエンジニアとしてキャリアを積むことにしたのです。1社目のアドテク系の企業では、広告の費用対効果を最適化するために、データ分析を行い、その過程で膨大なデータをどう活用するか、そして効率的に運用するかを学びました。2社目のSaaS企業で取り組んだのは、データ基盤のリプレースプロジェクトです。小さなチームではありましたが、チームリードをしていました。
ー前職でも責任ある仕事をしていたのですね。アンドパッドに入社したのはどうしてだったのでしょうか?
学生時代から前職までの経験を通じて、データ活用と言ってもその内容や用途がとても幅広いことに気がつきました。その全てを経験して、応用できるようになりたいと思っていたのです。データ活用の知見が深まれば、ビジネスの課題に対しても、適切なアプローチを提案できます。
アンドパッドに入社したのは、データ活用に関する幅広い経験ができる上、データ活用の方向性も、データ基盤の構築も、主体的に進められる環境だと感じたからです。当時のアンドパッドにもデータ基盤はありました。しかしながら、まだ活用しきれていない状態だったのです。また、前職では最初からチームを立ち上げた経験はなかったため、「データ基盤チームのイチからの立ち上げ」にも挑戦したいと思いました。
最終的には、データの民主化を実現したいとも思っています。データの民主化とは、社内の誰もが必要に応じて、データを抽出・集計できる環境をつくることであり、その実現のためには、「必要なデータがそろっていること」「データがただあるだけでなく、活用しやすい形に加工されていること」「社員全員のデータに対するリテラシーを高めること」が必要だと思っています。また、社内だけでなく、ユーザー企業の方々にもデータの分析環境を提供し、「ANDPAD」を通じてデータを活用していただけるようにしたいと思っています。
アンドパッドに入社後は、データを活用して経営的な意思決定をするためのプロジェクトが発足したところだったので、経営の意思決定に活用するデータの整理からとりかかりました。自社の売上のデータはSalesforce(営業支援・顧客管理を行うビジネスアプリケーション)から、カスタマーエクスペリエンス(カスタマーサポート)チームが取り扱っている顧客とのやりとりに関連するデータはkintone(Webデータベース型の業務アプリ構築クラウドサービス)から引っ張っるようにしました。「ANDPAD」の機能が、ユーザー企業の業務プロセスに組み込まれているか調査するためのデータも自社で蓄積しています。
このように、当社が取り扱うデータは多岐に渡るため、データを整理して取り出すためにデータ基盤をつくるプロジェクトを立ち上げて、チームで取り組んできました。
ーデータ基盤づくりはどのように進められたのでしょうか。
データをData WareHouse(分析に必要な多種多様なデータを集約した統合データ)に貯める仕組みをつくりました。またサーバーのログを分析したいという要望もあり、それもData WareHouseに繋いでいます。Salesforceのデータも同じです。ただデータを貯めるだけだと分析が大変なため、データ分析をしやすい粒度のデータに加工しています。
例えば、SaaS KPIの一つMRR(Monthly Recurring Revenue/月次経常収益)を日次で見られるようにするため、Salesforceに入っているデータからそのままプログラムを実行しようとした場合、300行から500行くらいプログラムを書かなくてはなりませんでした。現在は、3行くらい書けばデータを持ってこられる仕組みになっています。
スタースキーマで設計し、Dataformでデータ加工。データ分析をしやすい環境をつくる。
ーデータ基盤をつくる上での技術的に新しいトライはありましたか?
先ほど少しお話ししたデータ加工の仕組みをつくるところが、新しいトライでした。データ基盤を整備する前は、SalesforceなどのSaaSや、データベースのテーブルをBigQuery(Google Cloud が提供するデータウェアハウス)に移している状態でした。そのままでは使いにくいということで、テーブルの設計を変えたのです。具体的には「スタースキーマ」と呼ばれる構造で設計しています。
スタースキーマはディメンションテーブルとファクトテーブルという2種類のテーブルを使ったものです。ファクトテーブルは、数値の値と関連したディメンションのキーを格納しています。ディメンションテーブルは、分析の切り口となるデータを格納しています。
ファクトテーブルは、ディメンションのキー項目があり、ファクトテーブル1つに対して様々なカテゴリのディメンションテーブルが紐づいています。それを図で表すと星形に見えることからスタースキーマと呼ばれています。このように整理すると、多様な切り口から分析しやすくなるのです。
これに加えてDataformというツールを導入しました。Dataformはデータを加工し、分析しやすいテーブルをつくるために使います。自動とまではいかないですが、一度組んでしまえば工数をかけずにデータ加工しやすくなります。
Dataformを選んだのは、導入の敷居が低く、メンバーにも理解してもらいやすいからです。データ基盤を試行錯誤しながらオペレーションしていく段階だったので、メンバーがストレスなく使えるものが理想でした。
また、自分たちが使いやすいように仕組みとルールを慎重に決めていったことも、新しいトライです。例えば、KPI設計をするためのデータも、単位が異なるものが集計されていることがあります。だから「アンドパッドにおけるMRR」を定義する必要があるのです。それと合わせて、定義したデータを簡単に参照して、レポートできる仕組みをつくっています。
ー扱いやすくなったデータ基盤を、今はどのように役立てていますか。
経営の意思決定にデータを用いる「データドリブン経営」という言葉が浸透してきました。とはいえ、データを有効に利用できている企業は、実際にはそれほど多くないように感じています。そのような中、アンドパッドはデータ活用に積極的ですし、それが実際のアクションに繋がっているので、経営的な意思決定を支援するやりがいを感じているところです。
カスタマーサクセスチームや営業との連携も活発になってきました。ユーザーの動きを表すデータをカスタマーサクセスチームや開発チームと共有して、サービスや開発に役立てることもあります。例えば、施工管理の現場で職人さんたちが効果的に「ANDPAD」を使えているのかどうかわかるように、可視化する仕組みをつくりました。
依頼を受けてデータを分析するだけではなく、こちらから営業部門にデータ活用を提案することもあります。例えば、データ分析の結果を元に「こうしたらアップセルできるんじゃないか」という仮説を立て提案したりしています。
求めるのは理念への共感とビジネス視点。ゆくゆくは機械学習やAI関連の知見も生かせる。
ー今後、データエンジニアへの期待が大きくなると予想されますが、須貝さんはどんな人と働きたいですか?
アンドパッドのミッション・ビジョン・バリューへの共感を持ち、ビジネス的な視点がある人が、熱意を持って取り組める環境なのではないかなと思います。
機械学習やAI関連のプロジェクトに取り組みたいというエンジニアも多いと思います。今はその段階にありませんが、ゆくゆくは機械学習やAIの技術スキルを生かすことができるフェーズがくるはずです。
また、アンドパッドのデータ基盤チームはまだまだ小さいですから、「こういうチームにしたい」「こういう貢献をしたい」という想いを叶えられる環境です。主体的に動ける人にとってはエキサイティングなフィールドだと思います。
ー最後に、これからやりたいことを教えてください!
営業が目標とする売上に無事着地するかどうか予測する仕組みをつくってほしいと言われています。これは経営計画の精度に関わる重要な仕事なので、ぜひやりたいです。このほか「データを使ってこんなことできませんか?」という相談をされることが多いので、その期待に丁寧に応えていきます。
また、これまでは営業部門やカスタマーサクセス部門などビジネスサイドの要望に応えるための仕事が多かったのですが、プロダクトチームの要望に応えたり、こちらから提案できるフェーズに入ってきました。
最終的には、ユーザーの方々が「ANDPAD」に蓄積してきたデータを有効活用できる環境も構築したいと思っています。しっかりと「ANDPAD」を活用していれば、意思決定に使えるデータを揃えられます。「ANDPAD」を使うことで便利になるだけでなく、「溜めたデータを意思決定に使える環境も整っている」というところを目指したいです。
今後は、機械学習にも積極的に取り組んでいきたいなと思っています。いずれは、「横断的に検索できる検索エンジン」や「写真や資料を自動で分類する機能」、「工程表を自動で生成する機能」や「施工の不備をその場で検知する機能」などにも着手したいです。プロダクトをより良くするためのデータ活用を提案して、貢献していくチームをつくりたいと思っています。
アンドパッドは建築・建設業界全体の生産性を改善するプラットフォーム化の実現を目指して開発を進めています。まだ成長過程にあるプロダクトにおいて、建築・建設業に寄り添いながらDX化を進めていくためには、開発体制のさらなる強化が不可欠です。
「ANDPAD」がよりプロダクトの成長にドライブをかけていく中、意思決定の軸やプロダクト開発の軸としてのデータ活用をより推進していきます。いずれはデータ処理システムの構築だけでなく、運用や機械学習などにも関わっていただくことになるでしょう。
データ基盤エンジニアとして、各方面のエンジニアと協力しながら、建築・建設業の生産性向上を共に実現してくださる方がジョインしてくださるのを待ち望んでいます。