「Tableauで始めるデータサイエンス」で勉強した
目的
- Tableauにとにかく慣れるために演習したい
- ついでにデータサイエンスの一連の流れを体感したい
業務でTableauを触るのですが、初心者すぎて全然できません。用語がわからないため、ググり方もわからず、先輩の仕事をかなり妨げています。
いくつか例題のシートなり、ダッシュボードなり作ったのですが、全くしっくりこないというか、身になっている感じがしません。質の問題もあるかもしれませんが、いったんは量をまずこなしてみようと思い、こちらの本をやることにしました
読書所感
フォント、レイアウトが気に入っており、楽しく進められました。操作画面が都度載っているため、初心者でも真似して作ればそのまま再現できます
一点、Graphvizのインストールでつまづいて、2日くらい溶かしました
- macOS
- Anaconda
- JupyterNotebook
conda install で上手くいかず、公式ドキュメント通りに brew install graphviz で上手く行きました
検索しても、インストールうまくいかないwindowsの事例ばかりで、macが見つけられなかったことと、かつAnacondaで使おうとする場合で探していたので、遠まわりしてしまいました。
Anacondaなのに brew install して大丈夫なのかは不明だけど、今のところ大丈夫です。仕事用の環境でもないし、趣味勉強用の環境なので動けば何でもいいかなとか
予測モデルをJupyterで作り、予測結果を追加してCSVに出力。出力したCSVを使って、Tableauで可視化します
課題は、銀行の定期預金のテレアポで申し込みをしそうな人が誰か予測するモデルを作って可視化し、営業さんがダッシュボードを見て、どの顧客を優先して営業活動すれば良いかがわかるようにする、といったものです
作ったダッシュボードはこんな感じです
何かクリエイティブを発揮したわけじゃなくて、テキストの真似して作っただけなので、内容詳細は省きます。
棒グラフが赤いほど、申し込みしてくれそうだという予測がされている顧客です。その顧客の住所を地図にプロットしています(青は申し込み確度が低い顧客)
地図や棒グラフの表示は、23区ごとに選択して表示することもできるようにしました(新宿区の顧客だけ見たい時は、23区選択の横棒グラフをクリックするか、右のフィルターをクリックします)
実務でのデータ分析サイクルを意識して書かれており、かなりイメージが湧きますので、まだ学生だけどこういう職種に興味ある人とか私みたいな初心者で業務イメージが膨らんでいない人にはおすすめです(ベテランには向いてません)