データサイエンティストのひよこ成長日記 Vol.4 ー Tableauはじめました ー

f:id:yuzuhiko_persol:20210518163631p:plain
みなさん、こんにちは!デジタルテクノロジー統括部に入社して二年目の長谷川智彦です。データサイエンス未経験の新卒がどのように成長していくのかをつづっている「データサイエンティストのひよこ成長日記」、今回は最近勉強を始めているTableauについて記事にしていこうと思います!

もうすぐ今年も終わってしまいますね、今年は友人と毎年恒例の福袋を買いに行けるのを楽しみにしている長谷川です(昨年はコロナで断念しましたが、今年は行くとしても対策は万全にしますよ!)。

さて、最近嬉しいことに仕事でモテ期(モテ期:業務が色々とやってくる状態)が到来しており、作業の高速化を求められています。そこで、分析や可視化についてはTableauを活用しようと決心し、勉強を進めております。今回はこのTableauに関しての簡単な記事です。

What is Tableau?

私生活でTableauの単語を出すと「それは何?」となることが最近わかったので簡単にTableauの紹介をさせていただきます。
Tableauは大きくはBI(ビジネスインテリジェンス)ツールというカテゴリーに含まれており、データの連携、分析、可視化・レポーティングまでをツール内でほぼノーコードで行うことができます。Salesforce社が2019年に買収したことでも話題になりました。

ただ、旧来のBIツールよりもTableauが優れているのは、ビジネス要件に合わせて簡単に分析できることとそのビジュアライゼーション能力にあります。
旧来のBIツールではビジネス要件を決め、その要件に沿った分析用プログラミングコードを書く必要があったり、テーブルを整備する必要性がありました。かつ、それ以外の分析結果が知りたい場合は再度要件を定義し作っていくことが必要でした。
一方、Tableauはデータベース等のテーブルデータと連携さえできれば、その場でニーズに合わせた分析結果をほぼノーコードで作成することができます(Tableau Prepを使えば、データの前処理も簡単にできます)。

また、下記の写真のように左の変数からドラッグ&ドロップで簡単にグラフ等を可視化できるのが特徴です。

f:id:yuzuhiko_persol:20211122134153p:plain
ホームページURL:https://www.tableau.com/ja-jp/why-tableau


可視化のパターンもたくさんあり、よくある折れ線グラフや散布図だけでなく、写真にあるような複雑そうなグラフの可視化もできてしまいます(本当は実際の分析画面を載せたいのですが、セキュリティの関係上、Tableauのホームページからお借りしました)。

f:id:yuzuhiko_persol:20211122134236p:plain
ホームページURL:https://www.tableau.com/ja-jp/products/cloud-bi


Why Tableau?

さて、なぜTableauを学び始めたかというと、
・データベースに連携できる
・テーブル同士の結合や簡単な前処理が必要
・機械学習や複雑なデータの前処理は必要ない(Tabpyを使えばこれもできます)
・可視化することで相手にわかりやすく伝えたい

以上の分析要件が増えてきたのでここの部分に優位性があるTableauでサクッと分析を終わらせてしまいたいという思惑があったからです。

下にExcel、Tableau、Pythonでの分析の個人的な比較表とこれまでとこれからの分析業務フローを図で簡単に示しました。
やりたいことしては分析手段ごとの長所を活かして『適切な時に適切な分析手段を選び、早く分析を終わらせること』です。
f:id:yuzuhiko_persol:20211122134314p:plain
f:id:yuzuhiko_persol:20211122134342p:plain

現時点では、
・データ連携の必要なし&データ量がそこまで多くない&簡単な表計算orグラフの作成・可視化の案件
→Excel
・データ連携が必要&大量のデータの案件すべて
→Python&SQLで何とかする
で行っています(SQLを書いてExcelで処理することもたまにありますが)。
しかし、表で示したようにPythonでちゃんとしたグラフを作成しようとすると、時間が多少かかりめんどくさいです。もちろんMatplotlibやSeaborn、最近ではHoloviewsなどのライブラリを活用して可視化は行います。ですが、コードを調べ、細かい設定をしてきれいに可視化するのは、いかんせんめんどくさいのです。めんどくさがりで申し訳ないのですがめんどくさいのです!(笑)

ただ、ここでTableauが使えるようになると
・データ連携が必要&大量のデータ&簡単な分析と可視化がメイン
の案件に対して、コードを探す手間も少なく可視化できます(実際に練習していて手軽さに感動しました)。
また、簡単なデータの前処理やテーブルの結合もTableau Prepを使ってできるので大部分の分析はできてしまいます。
となれば、皆さんでも使いたくなる気持ちは察していただけると思います。
ということで、これからますますビジネスとしての業務は増えていくのでTableauを覚えて、プロジェクトをガンガン回せるマンになろうと思うのでよろしくお願いします
(To 社内の皆さま:面白い案件がありましたら是非お声がけください)。


最後に

おそらく、今年はこの記事で最後となります。年明けも『データサイエンティストのひよこ成長日記』を執筆する予定ですので、引き続き応援いただけると幸いです。
それではみなさん良いお年を!



alt


長谷川 智彦 Tomohiko Hasegawa


デジタルテクノロジー統括部 デジタルビジネス部 ビジネスグループ

大学時代の専攻は植物学・分子生物学。最近趣味でデザインをかじり出した社会人2年目。植物の実験データを正しく解釈するために統計を勉強し始め、データ分析に興味をもつ。データサイエンスはただいま必死に勉強中。

※2021年11月現在の情報です。

▶パーソルキャリアの求人ページはこちらから