【研修日記】データサイエンス未経験の私が研修3ヶ月で実施したデータ分析研修のお話
Photo by Toa Heftiba on Unsplash
こんにちは。
セラク・みどりクラウド事業部の技術部門リーダーの植田です。
データサイエンティストを目指すメンバーが研修日記を作成してくれたので紹介したいと思います。
自己紹介
こんにちは。
セラク・みどりクラウド事業部のデータサイエンティスト(研修生)のY・Iです。
まず簡単に経歴を紹介させて頂きます。
前職では、『生産物流シミュレータを用いた最適化提案』という仕事をしていました。
生産物流シミュレータとは、自動車・精密機械・化粧品・お菓子などの、様々な製造工場において、工場レイアウトを検討する為のツールです。
導入する機械の台数を検討したい、配置場所を何パターンか試したい、コンベアはどのようなルートで流すのが良いのか、など、様々な課題を持ったお客様がいましたが、私はその中でも、『作業員の配置最適化問題』について深く取り組んでおりました。
作業員の性別・勤怠状況・スキルなどの生のデータを取得し、そのデータから作業員の最適な配置場所を見出し提案する、というような業務を行なっていました。
このように、データに触れた仕事をしてはいましたが、世間一般で言われる『データサイエンス』と呼べるほどのレベルではありませんでした。
そこで、もっとデータサイエンティストとしてスキルを深めたい、幅広い分野のデータを分析してみたい、という思いが積もり、ご縁もあってセラクに転職しました。
今回は、私が入社して勉強してきたデータ分析の、集大成として実施したデータ分析研修について、お話しさせて頂きます。
研修内容
前職での業務内容について述べさせて頂きましたが、前提条件として、私はデータサイエンス未経験者です。
Pythonは基本的な構文が書けたり、機械学習に関してはG検定を取得しており多少の知識はありますが、これらを業務でガッツリ使用した経験はなく、つまるところ、初心者に毛が生えた程度のレベルです。
そんな未経験だらけである私は、今日まで次のような研修ステップを歩んできました。
1ヶ月目:Pythonの学習、データ分析で使用するライブラリの学習、データ分析100本ノック
2ヶ月目:kaggleコンペの課題取り組み(合計4つのコンペにチャレンジ)
3ヶ月目:データ分析研修
1ヶ月目は、データ分析に必要な構文やライブラリが使えるようになるため、とにかくPythonの学習をしました。
この時、知識の定着度を測るため、『Python3 エンジニア認定データ分析試験』という、オデッセイ社が運営する試験を受験しましたが、無事合格できました。(よかった。。。)
2ヶ月目は、まずはkaggleのコンペの登竜門である、タイタニック問題や、住宅価格予測問題に取り組みました。
Pythonの基本的な部分は理解したはずですが、自分でコードを書いてアウトプットしていくのはとても大変でした。
上記2つの課題では、先輩や上司が実施した分析データがあるため、それを参考に使うことで他の知見やアプローチ方法を学ぶことができました。
なんとか2つの課題をある程度のレベルまでやり切ることができましたが、データ分析の感覚というか、勘どころを掴もうと、もう2つほどのコンペに参加し反復練習しました。
3ヶ月目は、いよいよ分析研修のスタートです。
『職種毎の業務特性パターン分析』というテーマで、厚生労働省が一般公開している職種毎のアンケート結果から、業務に対するストレスのかかり具合が類似している職種を抽出する、という目的でデータ分析を実施しました。
具体的な作業時間として、大まかではありますが、
・データの取得、前処理 : 3日
・学習、分析結果の可視化 : 2日
・分析結果の妥当性の確認、再学習など : 3日
・中間報告会、最終報告会プレゼン資料作成 : 2日
のように、ちょうど2週間の期間で取り組みました。
最終報告会では、立派なデータ分析とは呼べないレベルではありますが、私が導き出したデータを元にあれやこれやとディスカッションをして頂き、そこに私の考察も交えることで、データサイエンス(っぽいこと)をしている実感が得られました。
私が気付かなかった新たな着眼点や、データの捉え方などを学ぶことができ、かなり充実した研修内容となりました。
現在は、機会学習手法や統計の知識を身につけたり、力試しとして、統計検定の勉強や、kaggleの課題に取り組んでいます。
最後に
セラクには、人それぞれのレベルにあった研修内容が用意されています。
私のような未経験者には、基礎的な内容から、実際のデータ分析の研修。
データサイエンス経験者には、自社のヘルスケアアプリケーションのデータ分析など、より実務的な研修。
また、弊部にはデータサイエンススキルチェックシートというものがあり、そのチェックシートを元に先輩や上司が研修内容を考えてくださるので、自分の能力に大きく外れるような研修にはなりません。
私も、一歩一歩ではありますが、日々の研修で自分の力が付いていっていることを実感しています。
データサイエンスに興味がある、さらにデータサイエンスの腕を磨きたいという方は、是非セラクにいらしてください。