データサイエンティストのひよこ成長日記 Vol.3 ーサイトログデータの学びー

f:id:yuzuhiko_persol:20210518163631p:plain

みなさん、こんにちは!デジタルテクノロジー統括部に入社して二年目の長谷川智彦です。データサイエンス未経験の新卒がどのように成長していくのかをつづっている「データサイエンティストのひよこ成長日記」、今回は最近取り組んでいるサイトログデータについて学んでいることを記事にしていこうと思います!
 
 
段々と気温も下がってきて秋になってきましたね、コロナがもう少し収まったら運動がてら外に出ようと思い、クロスバイクを買った長谷川です。
さて、そんな長谷川が最近何をしているかというと、とある施策の関係でサイトログデータを分析していました。
今回はそのサイトログデータを使うと何が変わるのかやどういう指標を見ているのかについてまとめていきます


サイトログデータを使うメリット

「そもそも、サイトログデータってなんだ?」といった方もいらっしゃると思うので簡単に説明すると、ユーザーがWebサイトで行動した時に残る行動履歴です(※個人情報取扱の規定に則り、適切に利用しています)。
 
みなさん、普段の生活の中でWebサイトを利用されると思うのですが、Webサイトを利用すると、どこからそのWebサイトに到達してくれたのかやどのページを見てくれていたかなどの履歴がデータとして企業側に残っていたりします。
最近は多くの企業でこのWebサイトのログデータを分析して、より顧客のニーズに合わせた取り組みをしようといった流れが出てきており、個人的にも『顧客の行動をより踏まえた施策を打てる』というところがサイトログデータを活用するメリットだと感じます。
 

ここまでだとまだイメージしづらいと思うのでもう少し具体的に説明します。
データの中には性別や年齢、職業、住所などのその人の属性を表す属性データとWebサイトログデータやユーザーがどの店舗で何を購入したかなどの行動を表す行動データがあります。
企業が広報、営業活動などの取り組みを行う際にはこれらのデータを使って、誰を狙うかを絞っていくのですが、属性データだけの時と行動データもある時ではこのターゲットとするユーザーの解像度の粒度が変わってきます。
 
長谷川を例にすると、
【属性データだけの場合】
年齢:20代後半
性別:男性
業種:人材サービス
職種:データサイエンティスト(or 企画職)
転職回数:0回
希望条件:〇〇
 
【行動データ(Webサイトログ)も加えた場合】
年齢:20代後半
性別:男性
業種:人材サービス
職種:データサイエンティスト(or 企画職)
転職回数:0回
希望条件:〇〇
サービスの利用
午前中(10時〜12時)
週3回サイトに訪問する(月、金、土)
平均1時間滞在している
ページAだけでなくキャンペーンページも閲覧した
登録時はあまり使っていなかったがここ2週間で急に利用し始めた
 
といった感じです。この2つを比較したとき、やはり後者の方が広告や営業活動などの施策を打つとしても効率的に効果が出そうであるのがイメージできると思います。

f:id:yuzuhiko_persol:20210914195630p:plain

特にWebサイトをベースとしたサービスだと
・顧客が現在アクティブな状態なのか
・どこから流入しているのか
・いつサイトに訪れているのか(時間、曜日など)
・何を見ているのか、どんな順番で見ているのか
・どれくらいの時間見ているのか
・これまでと比較してどんな行動の変化があったか

といったことがわかるので、これらの情報を活用しようと動き出しています。
 

どんな行動を見ているのか

サイトログを使うと以下のことがわかると書きました。
・顧客が現在アクティブな状態なのか
・どこから流入しているのか
・いつサイトに訪れているのか(時間、曜日など)
・何を見ているのか、どんな順番で見ているのか
・どれくらいの時間見ているのか
・これまでと比較してどんな行動の変化があったか
現在取り組んでいる施策ではこれらをデータとして捉えるために次の項目を主に分析しています。

【分析した項目(一部)】
・ページ訪問回数
・サイトの回遊フロー
・訪問日時
・滞在時間
・各項目の時系列変化

 ここからはこれらを分析するとどんなことがわかるのかについてTipsを書いていきます。

【分析項目とTips】
・ページ訪問回数:名前の通りでユーザーがページに訪れてくれた回数をカウントします。サイトのメインページであれば、この訪問数がある期間内であればユーザーはサービスを利用はしてくれている可能性が上がります。
逆にしばらくサイト訪問がないのであればすでにサービスから離脱している可能性が大きくなります。
アクティブなユーザーかそうでないかの判断材料の一つになるので非アクティブなユーザーを除いて施策を打つことができ、施策の本当の効果が見えやすくなります。
 
・サイトの回遊フロー:Webサイトには複数のページが階層的に設計されているのですが、ユーザーがどういった順番で各ページを動いていることも調べることができます。最近の分析ツールだと可視化もしてくれてすぐにわかるようになっています(すごく便利です)。
個人的に上のページ訪問数を集計する際には必ずこのサイトフローを確認することをオススメします。というのも、訪問数を計測する際には必ずユーザーが訪れるページを設定して計測する必要があるのですが、このフローを確認しておかないとそれがどのページなのかが曖昧なま誤判断を誘導する危険性があるからです。
 
・訪問日時:ユーザーがいつ訪れてくれたのかの日付と時間がデータとして残っているのでこれを分析します。月、週、日単位で何回サイトに訪れてくれたのかや何曜に来てくれているのか、何時に訪れてくれるのかなどのユーザーのバイオリズムを捉えられれば、例えば、そのユーザーがログインする時間帯にメールを送るなどの取り組みができるため、施策の成功に繋がりやすくなります。
 
・滞在時間:ユーザーがページをどれだけの時間滞在してくれていたかを計測できます。
これはそのユーザーの興味や熱度のようなところと相関する可能性が高いため確認しています。
イメージしやすいと思いますが、興味がある内容であれば一定時間をかけてみるので滞在時間が長く、興味が無かったり、確認しただけだとこの時間が短くなると考えられるので大事になってくる指標です。
 
・各項目の時系列変化:最後に時間が経った時の行動の変化ですが、これが個人的には一番大事だと考えています。
少し前まで全く行動がなかったユーザーが急にサイトに訪れ、閲覧してくれる時間が伸びた場合、そのユーザーは現時点である程度自社のサービスに興味がある状態なので、このユーザーを捉えキャンペーンなどの施策が打てると効果が出やすくなるからです。
逆に訪問してくれていたユーザーの行動量が減少してきていたら、なんらかの理由で興味が薄れていることが考えられるので、その原因を早く見つけるきっかけになったり、離脱を防ぐ施策に切り替えることを検討したりできます。
また、訪問時間や曜日が変われば、なんらかの理由で生活リズムが変わった可能性があるので、新しい生活リズムに合わせて施策を切り替えることができたりもするため、この行動の時間変化を捉えることが重要です。

このような感じでサイトログから得れる指標からユーザーの状態をとらえることができます。
是非、これからサイトログデータの活用を考えている方は参考にしてみてください。
 

プロジェクトとしての回し方・現時点でのTips

現段階で上記のような変化が捉えられ、より顧客に寄り添った質の良いサービスを届けられるようにするためにパーソルキャリアでもサイトログデータの利活用を進めています。現時点での進め方の概要(詳細はまだ書けないので)としては以下のような感じです。

f:id:yuzuhiko_persol:20210916093743p:plain

まず、STEP1としてはサイトログをどう活用するかの目的を決めます。おそらくどのプロジェクトでもそうですが、なぜそうしたいのかの理由がないと始まらないのでサイトログが必要となる課題と、どのように活用する予定なのかの目的をある程度固めます。
 
次にSTEP2としては現場に近いメンバーとすり合わせながら、仮説を立てて分析と共有・議論のサイクルを何回も回します。
分析手段はPythonでもtableauでもなんでもいいと思います。個人的に大事なのは現場のメンバーの視点をヒアリングで拾い、素早く分析で検証することだと思っています。
やはり実際の現場のメンバーの声を聞くと、視点が違うので、追加でどういうことを分析すればいいかのヒントを得れたり、現場に馴染むインサイトの深い分析に繋がることが多いです。
 
何回もSTEP2のサイクルを回していくと、段々と使えそうな結果がちらほら生まれてくるので、今度はそれをどのように使っていくかの施策の検討に入ります。ここからは一般的な企画のフローと同じになってきて、フィジビリを行い、効果を測定する流れとなっていきます(現時点はここを確認していく段階に入りました)。
 
施策が動いている真っ最中なので、今回はここまでです。何かしらのいい結果が出てくれば別の記事として取り上げられればと思います。
 

最後に

今回はサイトログデータについてのまとめ記事を書きました。
具体的に何をしているかは書けなくて申し訳ないですが、これから活用を考えている方がいれば参考になると幸いです。
下半期も引き続きデータサイエンティストのひよこ成長日記は書いていくので次回お楽しみください!



alt


長谷川 智彦 Tomohiko Hasegawa


デジタルテクノロジー統括部 デジタルビジネス部 ビジネスグループ

大学時代の専攻は植物学・分子生物学。最近趣味でデザインをかじり出した社会人2年目。植物の実験データを正しく解釈するために統計を勉強し始め、データ分析に興味をもつ。データサイエンスはただいま必死に勉強中。

※2021年9月現在の情報です。

▶パーソルキャリアの求人ページはこちらから