【Tableauチャレンジ】Tableauで表現できる基本チャートについて①
Photo by Clay Banks on Unsplash
読了まで7分
こんにちは。システム開発部の秦です。
今回のストーリーでは、Tableauで表現できる基本チャートについてご紹介します。
「PROOFはSalesforceエンジニアのSES企業のはずなのに、なぜTableau?」
と思った方もいらっしゃると思います。
Tableauは2013年にアメリカ・シアトルで開発されたBIツールで、2019年にSalesforce社の製品となりました。
実際に、案件ではSalesforceとTableauを連携していることが多いです。やはり同一企業の製品であると親和性が高く、開発や保守がしやすいことが挙げられると思います。
最初はSalesforceの保守で参画していた案件でも、「Tableauができる人はいませんか?」と聞かれることがあります。「SalesforceもTableauのことも分かる人材」はまだまだ少ないです。
「そんな時に手を挙げられるようになりたい」、そして「データそのものについて学習し、参画先やPROOFの成長に貢献できるようになりたい」、、など様々な思いからTableauについて学習しました。
その結果、弊社にはDATA Saberが2人います。
DATA Saberとは?
データ分析のスキルとマインドを身につけ、データドリブン文化を推進する人材を育成する、有志が運営しているプログラムです。
先日、2030年でプログラムを終了することが発表されました。
気になっている方は是非チェックしてみてください。
慣れないTableau操作・知識のあまりないデータ分野ということで、DATA Saber挑戦中はとにかく必死でした。
同時期にDATA Saber挑戦中の方(Apprentice)と自分を比べては「全然できてないな。。」と落ち込んだり。(既視感ありますねw Pathfinderプログラム受講中も似たようなことが。。)
そんなこともありましたが、Apprenticeの方々とイベントを企画して運営したり交流したりと、挑戦中は本当に楽しい日々でした。
しかし、90日間の挑戦を終えた後、どうしてもTableauに触れる機会が少なくなっていきました。
時間があるときは問題集を解いたりもしていましたが、それでもApprentice時代に比べると遥かに触れる時間が少ない。。!
せっかく習得した知識をこのままにしてしまうのはもったいない!
ということで、私自身の復習もかねて、こちらでTableauで表現できる基本チャートをご紹介させてください。
Tableauには以下のような特徴があります。
- ドラック&ドロップの直感的操作が可能。プログラミング知識が不要
- Tableauはチャートタイプの種類が多く、データの動きを的確に理解できるグラフの作成が可能。
分析の内容に合うチャートタイプが選択できるため、一目で分析の結果を伝えることができる。
データに対して最適なビジュアライゼーションで分析が実現できそうだということは上記から読み取れますね。
では、実際にTableauでどんなチャートが作れるのか、
Tableau Publicで用意されている、「サンプルスーパーストア」と呼ばれる架空のスーパーマーケットの販売データを用いて、簡単な利用シーンと共にご紹介していこうと思います。
目次
読了まで7分
表示形式について
棒グラフ(積み上げ棒グラフ・水平棒グラフ・並列棒グラフ)
線グラフ
散布図
円グラフ
ツリーマップ
クロス集計表
ハイライト表
表示形式について
チャートのご紹介に移るその前に、Tableauには表示形式という機能があります。
この機能はシェルフの行列に分析したいディメンションとメジャーを入れると、Tableau側が最適なチャートを提案をしてくれる機能です。
提案してくれるチャートの数は全部で24種類ありますが、
シェルフに入ったディメンション、メジャーを見て使用できるチャートは色が付いた状態で、Tableauが最も最適だと思ったものはオレンジの四角で囲まれお勧めしてくれます。
ディメンションやメジャーが足りず表現できないチャートは白っぽくなり、選択できません。
どんなチャートを選べばいいか分からない時には参考になりますし、自分で1から作ると手間のかかる表現でも簡単にできるので活用してみてください。
今回ご紹介するチャートは以下の通りです。
- 棒グラフ(積み上げ棒グラフ・水平棒グラフ・並列棒グラフ)
- 線グラフ
- 散布図
- 円グラフ
- ツリーマップ
- クロス集計表
- ハイライト表
(ーーーー下は次回に続きますーーーー)
- 箱ひげ図
- ヒストグラム
- ヒートマップ
- マップ表現
- 円ビュー
- 面グラフ
- バブルチャート
- ランクチャート
- ブレットグラフ
棒グラフ(積み上げ棒グラフ・水平棒グラフ・並列棒グラフ)
おそらく一番使用頻度が高いチャートかと思います。 データを並べて比較するのに最適なチャートです。ただ数字を比較するだけでなく、Tableauでは棒グラフに色を付けることで他のメジャーの結果も反映させることができます。
下記の図だと売上の棒グラフに利益の色を入れることでグラフに色をつけています。
テーブルは売上はそこそこいいけれども利益がマイナスであることがひと目見てわかります。
ディメンションを増やすと(オーダー日を追加)、下図のような並列棒グラフも作成できます。
売上の年ごとの推移と売り上げのうちカテゴリが占める割合が知りたい時は、カテゴリを色に入れると、下図のような積み上げ棒グラフができます。
表計算という技を合わせれば、1年間の売り上げを100%としたときのカテゴリが占める割合も出せます。
線グラフ
線グラフはデータが時系列に沿ってどのような変化をしているか傾向をつかむのに適しています。
下図は出荷モードにおける年・四半期ごとの売り上げの変化を経時的に表現しています。
下図のように、傾向線を引くこともできます。
翌日配送の需要にはあまり伸びはないが、通常配送は順調だ、セカンドクラスも伸びを見せているな、など分析結果が見えます。
カテゴリごとの売上推移も、色分けしてみることができます。
余談になりますが、
Tableauには予測機能もあり、その結果をチャートに反映させることもできます。
凡例に実績・推定とありますが推定がTableauが計算した予測部分です。
散布図
散布図は二つのメジャーの相関性を分析したいときに用いられます。原因になるものを列に、結果になるものを行に入れると、分かりやすいチャートが作れます。
下図はオーダーIDごとの売上と利益の相関を示したチャートです。色の不透明度を下げたことで、どの辺りの価格・利益にオーダーが集中しているかが分かります。
Tableauの場合は色や大きさなどを表現に加えることでさらに情報を追加できます。また外れ値なども簡単に見つけることができます。
先ほどの図に顧客区分を色に入れてみました。(これがいい分析かはさておき・・・)
さらにクラスターを追加すると、Tableauが自動計算してクラスターごとに色分けしてくれます。
クラスター数はTableauがおススメする自動も使えますし、こちらが具体的なクラスター数を決めてもOKです。
クラスターごとにグループを作って、どのクラスターにはどの顧客区分が多いか、という分析をすることもできます。
円グラフ
お馴染みの円グラフだと思います。あるデータにおける構成要素を円の面積と角度を用いて表すグラフです。
下図のグラフは、それぞれのカテゴリが売り上げ全体の何%を占めるかを表しています。
円グラフは適切なシーンで利用しないと、見づらいチャートになってしまいます。
下図は都道府県ごとの売上の割合を円グラフで示しているのですが、パッと見でどの都道府県が一番大きい割合を占めているのかわかりづらいと思います。色使いも多く、ごちゃごちゃしている印象です。
凡例と円グラフの距離が遠くなってしまうと何が何だか分からないし、一目でパッと見てわかる円グラフを作りたいのであれば要素を2つか3つ程度に絞るのが良いかと思います。
例えば男女比を表すのであれば、非常に有用なチャートであるといえます。
ツリーマップ
ツリーマップは合計に対するデータの構成や値の違いを面積を使って比較するのに適したチャートです。円グラフにも似た特徴がありますが、円グラフとの違いはカテゴリごとにデータを分類して表示することができるという特徴があります。
先ほどの都道府県ごとの売上円グラフを表示形式を使ってクリック1回で下図のようなツリーマップに変換しました。
面積に加え色の濃淡で売り上げの占める割合を表現しています。
地方ごとで分けたい場合は、地方ごとに色を付けて分けることができます。
クロス集計表
クロス集計表は行と列に項目があり、合わさったセルの中に値や内容が書かれた表のことです。
Tableauはチャートの描画は得意ですが、表に変換する作業が苦手でよく画面が固まります。
この下図は過去、私がサンプルスーパーストアを用いて自作した問題です。
製品名ごとの、年単位の利益率を表したクロス集計表です。計算フィールドという機能を使うことで、利益率が赤字、黒字で▲▼の記号を付けたり色付けすることもできます。
また、利益率が連続で赤字であれば〇を付ける判定式も計算フィールドにて設定できます。
ハイライト表
ハイライト表は、クロス集計表に色を付けたもの、というイメージです。数字が苦手だ、色を付けて視覚的にわかりやすいものにしたい時に使えます。
下図は、カテゴリ-サブカテゴリごとの売上・利益・数量・割引率を顧客区分単位で表したクロス集計表に利益率を色に入れてハイライト表にしています。
消費者のテーブルが一番利益が低く、消費者の椅子が一番利益が高いのが一目見てわかります。
いかがでしたでしょうか?
少しでも業務の活用イメージがつきましたら幸いです。
続きは第2弾記事にて掲載予定です。お楽しみに!