「Tableauで始めるデータサイエンス」で勉強した

f:id:n_k_j:20220211232916j:image

Tableauで始めるデータサイエンス

 

目的

  • Tableauにとにかく慣れるために演習したい
  • ついでにデータサイエンスの一連の流れを体感したい

業務でTableauを触るのですが、初心者すぎて全然できません。用語がわからないため、ググり方もわからず、先輩の仕事をかなり妨げています。

いくつか例題のシートなり、ダッシュボードなり作ったのですが、全くしっくりこないというか、身になっている感じがしません。質の問題もあるかもしれませんが、いったんは量をまずこなしてみようと思い、こちらの本をやることにしました

読書所感

フォント、レイアウトが気に入っており、楽しく進められました。操作画面が都度載っているため、初心者でも真似して作ればそのまま再現できます

f:id:n_k_j:20220212003129p:plain

一点、Graphvizのインストールでつまづいて、2日くらい溶かしました

  • macOS
  • Anaconda
  • JupyterNotebook

conda install で上手くいかず、公式ドキュメント通りに brew install graphviz  で上手く行きました

検索しても、インストールうまくいかないwindowsの事例ばかりで、macが見つけられなかったことと、かつAnacondaで使おうとする場合で探していたので、遠まわりしてしまいました。

Anacondaなのに brew install して大丈夫なのかは不明だけど、今のところ大丈夫です。仕事用の環境でもないし、趣味勉強用の環境なので動けば何でもいいかなとか

f:id:n_k_j:20220212003056p:plain

予測モデルをJupyterで作り、予測結果を追加してCSVに出力。出力したCSVを使って、Tableauで可視化します

課題は、銀行の定期預金のテレアポで申し込みをしそうな人が誰か予測するモデルを作って可視化し、営業さんがダッシュボードを見て、どの顧客を優先して営業活動すれば良いかがわかるようにする、といったものです

作ったダッシュボードはこんな感じです

f:id:n_k_j:20220212003151p:plain

銀行顧客の定期預金申し込み推論をTableauダッシュボードで可視化した

何かクリエイティブを発揮したわけじゃなくて、テキストの真似して作っただけなので、内容詳細は省きます。

棒グラフが赤いほど、申し込みしてくれそうだという予測がされている顧客です。その顧客の住所を地図にプロットしています(青は申し込み確度が低い顧客)

地図や棒グラフの表示は、23区ごとに選択して表示することもできるようにしました(新宿区の顧客だけ見たい時は、23区選択の横棒グラフをクリックするか、右のフィルターをクリックします)

f:id:n_k_j:20220212003936p:plain

接触時間による申し込み成功の割合

実務でのデータ分析サイクルを意識して書かれており、かなりイメージが湧きますので、まだ学生だけどこういう職種に興味ある人とか私みたいな初心者で業務イメージが膨らんでいない人にはおすすめです(ベテランには向いてません)