ココナラよもやまブログ
ココナラは「知識・スキル・経験」など、みんなの得意を気軽に売り買いできるスキルのフリーマーケットです。友達に聞かれたり、お願いされるような「あなたの得意」を簡単出品。恋愛の相談から本格占い、キャッチコピー・ロゴ・イラスト作成まで何でも売り買いできます。そんなココナラの中の人のよもやま話を発信しています。
https://yomoyamablog.coconala.co.jp/
はじめまして!
9月にココナラに入社しました、マーケティンググループ兼開発グループの吉川です。
ココナラのマーケメンバーは こちらでも紹介されているように分析のために平気でSQLを書く者達の集まりです。入社前に話は聞いておりましたが、実際にこの目でその姿をみて驚いたのを覚えています。そんな中わたしは、マーケ専属エンジニアとして事業にコミットするべくココナラに参画しました。
マーケティンググループでは毎週勉強会が行われており、各々の専門分野に関する知識をメンバーに発信することで知見を広めたりスキル向上に励んでおります。
さてわたしは何を発信できるのだろうか・・・。
考えた結果、SQLも書けるマーケメンバーなのだからプログラミングもできてしまうのではないか。
某大手企業では、SQLでは困難な複雑処理を行うときにプログラミングや機械学習を使って分析をしているというのをよく聞きます。
せっかくマーケ専属エンジニアとして在籍しているのだから、技術に関する情報をグループ内に発信することで分析の幅が広がるのではないかと考えました。幸いなことにマーケティンググループでは週次で勉強会が行われておりますので、まずはそこで興味を持ってもらえるように発信してみようと思います。
本日はそのネタを少しご紹介させていただければと思います。
エンジニアでも苦労する環境構築。鬼門ともいえるこの負担をなくす、うってつけのサービスがあります。
Googleが機械学習の教育や研究用に提供しているツールであるGoogle Colaboratory。
公式ページにも説明されていますが、完全にクラウドで実行されるJupyterノートブック環境で、ブラウザからアクセスすれば環境構築はいりません。しかも無料で利用可能。
ココナラでは分析の元データをBigQueryに蓄積していますが、ColaboratoryはBigQueryからもデータを取得できるため、親和性もよさそうです。ちなみに現在サポートしている言語はPythonのみだそうです。
というわけでこちらを使って、プログラミングを活用したデータの可視化をしてみることにします。
扱うデータは、1912年に沈没し多くの犠牲者がでたタイタニック号の乗客リスト。
これをseabornという可視化ライブラリを利用してグラフにしていきます。 まずはデータを取得します。
import seaborn as sns
# データ取得して先頭10件を表示
titanic = sns.load_dataset("titanic")
titanic.head(10)
それぞれの項目の意味
取得したデータを元に、例えばタイタニック号の乗客の年齢分布を可視化してみます。
oldest_age = titanic['age'].max()
# 乗客全体の年齢分布
fig = sns.FacetGrid(titanic, aspect=3)
fig.map(sns.kdeplot, "age", shade=True)
fig.set(xlim=(0, oldest_age))
# 客室ごとの年齢分布
fig = sns.FacetGrid(titanic, hue="pclass",aspect=3)
fig.map(sns.kdeplot, 'age', shade= True)
fig.set(xlim=(0, oldest_age))
fig.add_legend()
乗客全体では20-30歳の乗客が多く、客室ごとに分類してみると1等客室の年齢層が2, 3等客室と比較して高いことがわかります。やはり富裕層が利用していたのでしょうか。
この続きはココナラよもやまブログでぜひご覧くださいませ!!
ココナラではエンジニア陣が中心となって、技術の話〜そうでない話までを肩肘張らずに書き連ねている「よもやまブログ」というブログを運営しています。
ココナラのエンジニアメンバーの人柄や雰囲気が伝わるであろう仕上がりになってるはずなので、お時間あるときにでもそっとのぞいていただけると嬉しいです!