膨大なデータを、正しく、早く、フル活用——データマート構築プロジェクトの知られざる物語

メンバー:小瀬憲人、鳥山誠、黒川恵太、美甘歩

パーソルキャリアが提供する転職サービス「doda」の累計会員数は、511万人以上(※2019年9月末時点)。それを支える分析システム基盤には、求人サイトやエージェントサービスなど、さまざまなサービスを通じて転職希望者や企業人事からお預かりした膨大な情報が蓄積されています。

しかし、そのデータを事業に活用しきれない状況が長きにわたって続いていました。たくさんのデータを持ちながらそれを意志決定に活用できていないことは、経営視点でも大きな課題だったのです。

その課題に立ち向かうため発足したのが、dodaの「データマート構築プロジェクト」。メンバーたちは、どんな困難に直面し、それにどう立ち向かったのでしょうか。メンバーの小瀬憲人、鳥山 誠、黒川恵太、美甘 歩に話を聞きました。

※鳥山は退職していますが、本人の同意を得て掲載を継続しています。

 

既存のデータベースの限界——チーム発足の背景

——データマートを構築するまでは、dodaにあるさまざまな情報を、どのように集計・分析していたんでしょうか?

鳥山:膨大な量のデータの中で、必要な情報をExcelに集計し、分析していました。しかし、これが徐々に追いつかなくなっていって。dodaには累計511万人以上(※2019年9月末時点)の会員がいるのですが、名前、性別といった基礎情報から希望する職種まで、一人あたり100項目以上の登録情報があります。さらに会員情報だけでなく、企業への直接応募やエージェント経由での応募といった行動がそれぞれ月間で数十万件単位で発生する……。会員情報と応募履歴を突き合わせるだけでも、数十万~数百万行といったレコードになるんですよ。

カスタマー戦略統括部リードエンジニア 鳥山誠

▲ カスタマー戦略統括部リードエンジニア 鳥山誠

黒川:そもそも加工の前にデータを準備するだけでも3日ぐらいかかっていましたよね。

——そんなに時間がかかっていたんですか! 時間だけでなく、データの集計を手動で行うのは非常に手間のかかる工程ですよね。

美甘:でも、当時はそれが当たり前だったんですよ。データがほしい社員からすると、最初に依頼してから受け取るまでに1週間、その後、加工して分析して考察を得て……と、最終的にデータを用意するまで、トータルで数週間近くかかるのが普通でした。

しかもExcelのシートを人の手で直接触るので、どこかにミスがあるかもしれないし、ミスがあっても分からない。数字を出すのに精一杯でした。そして、ようやくデータが用意できても、会議に出す頃にはすでにそのデータは古くて役に立たないこともあって。

鳥山:データ分析で判明する結果も限定的でした。「月にこれだけ登録があった」など“ある時点”での情報はわかっても、「何ヶ月前に会員登録した転職希望者が、どれくらいの転職活動期間を経て次の会社へ入社されたか」などの“時系列を追った”情報には非常に弱かった。「点のデータ」はあっても「線のデータ」がなかったんです。

——なるほど。そこで新たにデータマートを構築することになったのですね。

鳥山:そうですね。dodaの会員登録数は月に数万単位で増え続けているので、Excelでデータを集計するのも限界でしたから。

小瀬:それに、現行システムのままでは、わからないデータもあったんです。たとえば、鳥山さんがさっき言ってた「線のデータ」、つまり転職希望者の行動履歴がわかれば、より使いやすい転職サービスの提供ができると思うんです。ただ、dodaのWebサイトは月に数千万ヒットほどあるので、そこから会員登録、キャリアアドバイザーとの面談、求人への応募、面接、内定……といった候補者の一連の流れは、Webアクセスログだけではつかみづらい。

詳細な進捗情報は基幹システムにあるので、サイト上での動きを確認するにはWebアクセスと基幹システムを突き合わせる必要がありました。これはExcelではほぼ不可能で、基盤から見直さなければ手に入らないデータです。

カスタマー戦略統括部 シニアエンジニア 小瀬 憲人

▲ カスタマー戦略統括部 シニアエンジニア 小瀬憲人

鳥山: 加えて、dodaのサービス規模が拡大すると共に、データ分析がますます重要になってきたんですよ。ビジネスが拡張すれば、システムへの要求が変わるのは当たり前です。つまり、要求を満たすには、現在のシステムを改修するのではなく、要求に沿って「変えやすい」システムにする必要がある。根本からやりなおさなければならないなと思いました。

 

正しいデータを正しく分析するために——データマート構築の道のり

——このデータマート構築のプロジェクトは、どのような体制で行われたのでしょうか。

黒川:最初は部門長から声をかけられて、僕がひとりで調査をしていたんですよ。でも、当時のデータベースの状況を見ていても、何がどうなっているのか本当によくわからなくて(笑)。そこで初めて問題の深刻さに気がついたんです。

小瀬:そもそも、何が問題なのかすら、わからない状態でしたよね。

黒川:そう、本当に大変でした。で、「今の状態のままではどうしようもない」と判明したので、体制を整えるためにプロジェクトメンバーを増員してもらいました。現在はチーム全体で20~30人、そのうちコアメンバーが10名程度ですかね。高レベルの業務知見を必要とするので、開発はすべて内製で行っています。

カスタマー戦略統括部  黒川 恵太

▲カスタマー戦略統括部 黒川恵太

——さすがにおひとりでは大変ですものね。まずはどこから着手されたのでしょう。

黒川:まずは用語やデータの定義をはっきりさせるところからですね。たとえば「応募数」とひとくちに言っても、部署によってその言葉が意味するものが違うんですよ。企業への直接応募やスカウトメール経由での応募数を「応募」と呼ぶこともあれば、部署によっては「スカウトメール経由での応募は、数に含めない」というところもあって、細かく分類したら10種類近くの「応募」の定義があるんです。その認識が違ったままではシステム上のデータ区分に影響するので、まずはこうした定義を全て洗い出していきましたね。

小瀬:しかも、そうやって言葉の定義やSQLを確認するためには、各部署とのやりとりが必要不可欠で。それぞれに質問して各項目について詳しく確認したいけど、皆さん通常の業務があるので、コミュニケーションには非常に気を使いました。まずはメールで質問して、返事が無かったら直接その部署に出向いて……というのを、数え切れないほど行いましたね。地道で泥臭い作業でしたけど、品質を担保するには努力を惜しむわけにはいかないんですよ。正しいデータで正しく分析できないと意味がないですから。

——では、リリースに至るまでの開発はどのような工程で行われたのでしょうか。

鳥山:アジャイル開発手法である「スクラム」で行っていきました。2週間のスプリントで開発を回して、レビューをし、修正や要望を取り込むことを繰り返すという手法です。スクラムは、アプリ開発などのプロジェクトで使われることが多いもので、データマート開発のような大きなシステムにこの手法を用いるのは珍しいことだと思うんですよ。だから最初は本当にうまくいくのか半信半疑でしたね。

小瀬:でもスクラムで回したおかげで、進捗を把握しやすかったり、周囲からフィードバックを得られたりと、かなり良い形で進められたのもあるんですよね。

鳥山:設計にあたるときも、変化に柔軟に対応できるようあらかじめ準備をしておいたんです。例えば、テーブルによってはあえて毎日作り直すようにして修正にすぐ対応できるようにしたりとか。こうしておくことで、要望を受けて新たにカラムが増えても、定義を変えれば一晩で新しいテーブルができるので。

——なるほど。そういった作業に一区切りが付いて、データマートがいったん形になったのはいつ頃だったのですか?

鳥山:2018年8月の開発着手から、約3ヶ月で基本的な登録・退会・応募のデータを扱えるようになりましたね。ようやく「線のデータ」を表現できるようになった、という感じです。

美甘:その作業と並行して、小瀬さんがデータ定義を行っていましたよね。定例ミーティングの場ではどのデータを次に着手するか、優先順位をつけてコントロールしたり。

カスタマー戦略統括部 ビジネスプランニング 美甘 歩

▲ カスタマー戦略統括部 ビジネスプランニング 美甘 歩

小瀬:そうですね。データの定義以外では、KPI設計もだいぶ見直しました。何のためにデータ分析を行うのか、KPIがきちんと定まっていなければ、データマートを作っても意味がないと考えたんです。こちらもかなり苦労しながら形にしていったんですよ。

 

データマート完成——見えてきた効果と本質

——データマート開発と並行して、BIツールによるデータの可視化も進められたんですよね?

美甘:そうです。データ可視化のプロセスは、正直に言うとかなりのプレッシャーでした。せっかくデータの集計をしても、BIツールが上手く機能しなければその作業が無駄になってしまうので。エンジニアチームの苦労を知っているからこそ、それを背負っていると思うと……(笑)。事業活用のためには社内のデータリテラシーの底上げも必要で、そのためには誰が見てもわかりやすく、興味を持てるようにデータを可視化できることが大前提だったので、BIツールはその前提をクリアできるものを選びました。

小瀬:美甘さんにデータリテラシー向上のための定期的な社内教育を担当してもらったのは本当に助かりました。BIツールはただライセンスを渡しただけでは、十分に使いこなせないので。

美甘:そうなんです。ツールを入れた瞬間は盛り上がるんですけど、問題はそこから先の継続ですからね。当初は新機能が盛り込まれるたびに「こういうものを作りました」とお披露目する会を開いていました。他にも中途採用者や異動者のためにBIツール上で用語集を作るなどして、常に興味を持ってもらえるよう工夫していましたね。

鳥山:ビックリしたんですよ。「そんなことできるんだ!」って(笑)。

黒川:他にも、「そのデータを出すことに何の意味があるのか」「本当にこの定義で要求を満たせるのか」と、エンジニアチームから指摘をもらえたのもありがたかったですね。今回の取り組みがあってはじめて、データを扱うことで何ができるのかを教わりました。データの持ち方ひとつで、分析できることや粒度が全然違うんですよ。どういったサマリーでデータを出すかによって、見えてくる世界が本当に変わるんだな、と。

鳥山:これまでは「Excelでできること」という制約があったので、データを出す際は生データをある程度削ぎ落としてまとめていたんです。そうなると、いったん加工したデータを別の軸で集計し直したくなったとき、再びサマリーの作業が発生してしまう。でもこれは、全ての生データをデータベース化してあれば簡単な操作で済む話で。そういった点でも、利便性が大きく向上することを実感してもらえました。

f:id:ib_ofuji:20191028105512p:plain
——データマートを導入してから、社内ではどのような変化があったんでしょうか? 

小瀬:やはり「線のデータ」の必要性に気づく人が増えましたね。もっと掘り下げた分析ができるようになって、転職希望者や企業人事により良い提案をするために、データを活用したい、という声が増えました。

鳥山:今現在も、各部署から「こういうデータが欲しい」という依頼を受けるんですけど、その要望の質も上がってきたなと感じますね。今までは「とりあえずデータ全部欲しい」みたいなオーダーだったので、もっと絞り込んでもらうようエンジニア側からも働きかけたんですよ。

小瀬:そうなんです、「どういうデータがあれば要求が満たせるか」を依頼する側にも考えてもらおうと。要領を得ないリクエストに対しては、「何を知りたいんですか?」「そのために、このデータは必要ですか?」と、繰り返し確認していくんですよ。我々としても心を鬼にしてね(笑)。

鳥山:このサイクルを繰り返すごとに、社員からの要望がどんどん的確になっていきましたよね。「これを知るためには、このデータとあのデータが必要なんです」というように、ゴールを意識したオーダーが増えてきた体感があります。

メンバー2名

黒川:汎用的なデータベースに仕上がっているので、使う側に理解があれば引き出し方次第でどんな用途にも使えるんですよね。

小瀬:そうですね。採用にまつわる意志決定であるとか、キャリアカウンセラーのオペレーション向上であるとか、データ分析は「転職希望者と企業の採用成功の質を上げる」というサービスの本質につながるものです。データの変化に着目することで、よりきめ細かなサービスを提供できるんじゃないかと思います。

 

さらなる課題、そして、チームで得た学びと面白さ

——それでは、データマートのこれからの課題についてはどのように考えていますか?

鳥山:扱えるデータ量を増やしていかねばと、検討を進めているところですね。Webアクセスは月数千万ヒットありますし、登録者に送信するメールも億単位にもなります。これらのデータを分析するためには、億単位のレコードに対応しないといけない。そのためにはやはりアーキテクチャから見直さなければと考えています。

小瀬:他には、集まったデータの守り方にも気を配らないといけないんです。データマートに保管されているのは、あくまでも転職希望者や企業人事から「お預かりしている」データです。部署をまたぐときはもちろん、メタデータを参照するときにも、セキュリティを十分に配慮した上でデータを取り扱わないといけません。そのガバナンスは、今も徹底をしていますが、これからも利用者が増えれば整備して、常に取り扱いには最新の注意を払っていきます。

——こうしたデータマートのプロジェクトを通じて、皆さん自身が学んだことはありますか?

鳥山:ビジネスサイドにデータマートを普及させるために、「なぜこれが便利なのか」を言葉で伝える場面が多かったんです。そのためには自分の理解について解像度を高める必要がありましたし、それをきちんと言語化しないと相手に伝わらない。そこはずいぶん鍛えられたなと感じます。

対談メンバー

黒川:もっと質の良い分析要求を出そうと意識するようになりました。いくらデータが揃っていても、「これが欲しい」を正しく伝えられなければ、アウトプットにつながらないのだな、と。今回、エンジニアチームと接するなかで気づかされましたね。

美甘:私は、プロジェクトマネジャーとして、スピーディーに開発できる仕組みを作ることができたと思ってます。加えて、仲間を持つことの大切さを学びましたね。元々BIツールは私ひとりで担当していたんですけど、やはり1人では社内に広く浸透させることは難しいんですよ。チームで取り組むことで、今後社内に広く展開する土台を作れたなと思いますね。

——最後に、パーソルキャリアでエンジニアとして働くなかで、どんなところに面白さを感じますか。

小瀬:ゼロからのスタートを切りやすいところですかね。成熟しきった企業では既存の基盤に縛られることも多いと思いますけど、パーソルキャリアなら何もないからこそゼロベースで物事を決められる。その裁量権があるのはいいところだと思います。

美甘:ゼロからイチを作ることに喜びを感じる人には、もってこいの環境なんじゃないでしょうか。今いるメンバーもそうじゃないですか?

黒川:確かに。決まってないことを頑張れる人たちですよね。

鳥山:データマートは、いま「取得したデータを使って何をしようか?」というフェーズ。これからどんな技術を使い、どのようなシステムを作るのか、自ら提案できる状態です。まだまだ面白い領域が残っていますよ、とお伝えしておきたいですね。

(文=井上マサキ/編集=ノオト/撮影=栃久保誠)

メンバー

小瀬憲人

小瀬憲人 Kento Kose

マーケティング本部 カスタマー戦略統括部 カスタマー企画部 ビジネスエンジニアリンググループ シニアエンジニア

2018年中途入社。ERP・DWH・BI領域のエンジニアからコンサルタントを経験後、大手デジタルエージェンシーでビッグデータ分析基盤構築から、データ活用促進まで幅広く携わる。より自由度の高い環境を求めてパーソルキャリアに入社。

黒川恵太

黒川恵太 Keita Kurokawa

マーケティング本部 カスタマー戦略統括部 カスタマー企画部カスタマー戦略グループ

2014年中途入社。新卒で人材サービス企業に入社して、営業や求人制作といった職種を経験。より上流の企画に挑戦したいと考えパーソルキャリア入社。以降、企画・マーケティング畑を歩み、現職。

美甘歩

美甘 歩 Ayumi Mikamo

マーケティング本部 カスタマー戦略統括部 カスタマー企画部 ビジネスプランニンググループ

2015年中途入社。出版社での経験を経て、より大きなデータを扱いたいと考えパーソルキャリアに入社。アルバイト領域でBIツール周りの企画/設計/運用を担当し、2018年にBIプラットフォーム企業である、Tableau社の認定プログラムで、日本では100名しかもっていないと言われる「DATA Saber」の資格を持つ。2018年より現職。

鳥山 誠

鳥山 誠 Makoto Toriyama

マーケティング本部 カスタマー戦略統括部 カスタマー企画部 ビジネスエンジニアリンググループ リードエンジニア

2017年中途入社。新卒で大手メーカー系SIerの子会社に入社。複数の大規模プロジェクトに従事する。最先端の技術に触れ続けたい、システム企画にも携わりたいと考え、パーソルキャリアに入社。現在は退職。

※2020年1月現在の情報です。