BI活用を成功に導く!データカタログ構築プロジェクト

トップ画像

パーソルキャリアでは、2017年からPowerBIを用いたデータ活用を推進してきました。しかし、取り組みが全社に拡大する中で「データの持ち方」にさまざまな課題が発生。そこで、BI活用成功への土台づくりとして、データを整理し利活用しやすい状態にするべく「データカタログ構築プロジェクト」が始動しました。 

今回はプロジェクトを主導するデータ共通BITA部の小松と李にインタビューし、プロジェクトの現在地やそれぞれの思い、そして目指す世界観についてききました。

 

 

迅速で的確な事業判断・経営判断に欠かせないビッグデータの地盤固め

 

――まずは今回プロジェクトが始動した背景から教えてください。

小松:パーソルキャリアでは以前からBIツールを導入してデータ活用を推進しており、その取り組みは全事業部にまで着実に拡大しています。一方で、BI活用の拡大に伴って、CWH・DMやレポートの設計・開発・管理に必要な情報は増え続けました。

①情報が散在し、②情報どうしのつながりや中身の可視化が追いつかない、③足りない情報が何か分からない、という状態になっていきました。その結果、「レポートの作成」と「環境の管理」の両面に課題が発生しています。

例えばレポート作成者は、作りたいレポートに使えるデータソースを調査・選択する必要がありますが、データソースの数が多ければ、情報検索にかかる時間や手間が増えてしまいますよね。

インフラ基盤統括部 データ共通 BITA部 リードエンジニア 小松 一也

インフラ基盤統括部 データ共通BITA部 リードエンジニア 小松 一也

また「自分が必要とするCWH・DMやレポートと類似したものが存在するのか」が判別できない状況のため、各担当者が新しいものを作成する、ということが繰り返され、結果として似通ったCWH・DMやレポートが複数生成されやすい状態になっていました。

管理者としても、不要なレポートやCWH・DMの判断が容易ではありません。結果、BI環境コストの削減に向けたアクションをとるのが難しくなっています。

当初は、まずBI活用・推進の全社拡大を優先する方針で進めてきたので、こういった課題がいずれ顕在化することは想定していましたが、そろそろ整理を始めなければいけないなと、今回プロジェクトの始動を決断しました。

 

――BI化推進において情報の量や持ち方に課題が生まれるのは、ありがちなことなのでしょうか。

小松:前職でBI活用の支援を経験しましたが、複数の担当者がレポート作成に携わることで、情報の種類と量が膨大になったり、類似したものが生まれたり……という状態は、どのような組織でも起きがちであると考えます。ただ事業部や部署単位ではなく、全社でBI活用する事例はまだ多くないと私は思っていますので、その点で当社のケースは、利用者・情報の量や種類の多様さによる情報整理の難しさが顕著であるのかなと捉えています。

 

――このような課題があると、現場の担当者や管理者の業務効率が下がってしまう。その先に考えられるリスクや懸念を教えてください。

小松:データは作って終わりではなく自動更新していて、裏ではシステム内部の計算処理や集計処理が走っているので、データ量が膨大だとシステム負荷が上がってしまいます。

そうすると、データが増えるに従ってシステムのスペックを高めなければいけなくなるので、その分コストを要する懸念があります。また、システムのスペックを超える処理状態になってエラーが発生したり、複数の処理が重なって処理スピードが落ちたり、といったリスクも考えられますね。

加えて、似たような情報が散在して集約されていない状態だと、情報の信憑性も落ちかねません。例えば「応募者数」という指標があったとして、CWHやDMそれぞれで計算方法や絞り込み条件などの定義が異なっていると、同じ「応募者数」という指標でもどのCWH・DMを使うかによって数値が異なるという結果になってしまい、どれが見るべき数値なのか分からなくなってしまいます。1つの指標名で、複数の定義があると困ってしまうということですね。適切な事業判断や経営判断を行うためには、情報の定義を統一して標準化していくことも不可欠だと思っています。

 

――ビジネス全体にも影響を及ぼす大切なプロジェクトなのですね。今回は、課題の解決に向けてどのようなアクションをとられたのでしょうか。 

小松:積年の大きな課題なので、段階的なアクションが必要と考え、現在の状況から情報を整理していくためにまずは「情報の可視化」に着手しました。具体的には、今あるレポートの内容、そのレポートにはどのようなCWH・DMが使われているのか、そしてCWH・DMそれぞれのデータソースが何か、の可視化をスタートラインとして設定しました。

将来的なデータとレポートの最適化

将来的には、

  1. レポート作成時の情報検索コストの削減
  2. レポート閲覧情報を取得することによる、不要なレポート、CWH・DMの判別と削除
  3. 残った情報のうち類似するものの判定、統合

を行い、BI環境コストの削減、ひいてはデータとレポートの最適化を図っていきたいと考えています。

 

BI環境の最適化…はじめの一歩は、情報どうしの「つながり」の可視化

 

――情報の可視化のために実施したデータカタログの構築について、概要をお聞かせください。

小松:レポートやCWH・DMなどの情報を集約し、それぞれのつながりを可視化するためのシステムとして、今回データカタログを構築しました。

Power BIのレポート名と、そのレポートに使われているDMが何か

→そのDMがどのCWHから作られているのか

→そのCWHが、ARCS(*)やBAKS(*)内のどのようなデータを集合して作られているか…

といったデータを全て抽出し、抽出したデータを「連携情報」の形に加工してデータカタログに格納することで、流れを可視化しようという取り組みです。

 (*)ARCS, BAKS…エージェント事業の基幹システムで、転職希望者や企業からお預かりしたデータを保管しています

李:各テーブル内に複数の項目があるので、「どの項目がどのテーブルに入っているか」を示す情報まで細かに取得しています。また「レポート内の指標・項目がどのような定義になっているか」という点も、一部の事業部ではデータ収集を進めているところです。

 

――もとの情報自体は動かさず、アウトプットからたどって情報の「つながり」を見える化したのですね。

小松:今回は第一段階として、まずつながりの可視化から、ですね。RPGでいう、レベル1の冒険者というイメージでしょうか(笑)。

この可視化によって、各レポートに取り込まれている情報や、各テーブルに入っている項目が見えるので、ユーザーさんとしてはレポートの検索が容易になります。また逆引き的に、項目名を選択すると「その項目がどのレポート/テーブルに入っているか」が見えるので、レポート作成時に使いたい情報を選びやすくなると想定しています。

システム側としては、DMを作るためのSQLのロジックが確認できるほか、DMのもとになっているテーブルの情報や、「一つのDMをベースに、新たに作られたDMがあるかどうか」も確認できるので、管理が容易になるかなと思います。

データカタログ

データカタログ

――ユーザーと管理者の両方にとって価値があるシステムだと理解できましたが、これだけ膨大な量の情報を整理するのは大変そうですね……。手作業で一つひとつ進めなければいけない部分もあるのでしょうか。

小松:「あるテーブルにどの項目が入っているか」はシステム上、自動で情報取得ができるのですが、項目名での検索を可能にするための突合については、Power BIでデータモデルを作って行う必要がありますね。

また「Power BIのレポートにどのDMが使われているか」という情報取得は、現状200ほどあるレポートファイル一つひとつに対する手作業でしかできないので、そこは大変さがあります。ただ、取得した情報を整理してデータカタログに格納するレイアウトに加工するシステムを、李さんが新たに作ってくれたおかげで、その分の手作業の工数を大幅にカットすることができました。

 

李:手動で情報を取得するのは、時間も手間も多くかかってしまいますし、人の手によるミスも発生し得ます。現段階で全自動は難しくとも、できる限り人の手を介さないようシステム化しました。今後は、自動で全て情報取得できるよう、さらに検討を進めていきたいですね。

 

小松:そうですね。それと、レポート上の項目定義情報は自動取得ではなく、やはり事業に精通したユーザーさんに決めてもらう必要があります。大変な作業ではありますが、現在企画の方々にご協力いただいて進めているところです。

 

――“システムの土台をつくるためのシステム”を構築する、などの工夫しながら、情報と情報のつながりを見える化したということですね。今後はさらに、類似した情報可視化ができれば、次のステップで不要資源の判断をし、整理を進めていけるのですね。

小松:そうですね。情報の類似性を判断するためにも、今後は「テーブルがどこに置かれているのか」「各データの定義は何か」「各テーブルやその中の情報は何を表しているのか」といった情報も付加していく必要があります。

そしてその先のステップでは、レポートの閲覧率や閲覧数を取得して、定期的に棚卸しができるようにしていきたいと考えています。閲覧のされ方によって不要なレポートが判別できますし、さらにそのレポートに使われるDMが他のレポートで使われていないと確認できれば、それらが廃止可能な資源であると判断できますよね。また反対に、必要と思われるレポートがあまり閲覧されていない場合に、レポート自体の改修を検討することもできます。

このように、データの使われ方をチェックする手段を提供することで、不要資源の候補やレポートの問題点をあぶり出すことができます。本当に必要な情報を、適切な形式で保持することで、業務もシステムも互いに効率が良くなります。データカタログの整備を通じて、事業部側でもBI環境のコスト削減や最適化の視点を持ってレポート管理ができる状態にしていけたら嬉しいです。

 

データは会社の大切な資産――最大限に活用して顧客への貢献や利益創出につなげたい

 

――ここからはお二人の思いにフォーカスしてお話をお聞かせください。エンジニアである李さんは、今回のプロジェクトのお話を受けてどのような印象を持ちましたか?

李:初めは、驚きが大きかったですね。データカタログというと、ある企業がサービスとして提供するものを利用するイメージが強かったのですが、ツールを使って自分たちで構築するというのは初めて聞いたので、びっくりしつつ、面白くもありました。

インフラ基盤統括部 データ共通BITA部 エンジニア 李 丞容

インフラ基盤統括部 データ共通BITA部 エンジニア 李 丞容

またお話をいただいた当時はパーソルキャリアに入社したばかりで、データの全体像を把握するのに苦労していて。データカタログができれば、自分の仕事をより良くすることやデータ活用を進めることにも役立つので、頑張ろうという思いで参画したと記憶しています。

 

――面白さも感じられつつ、複数の事業部にまたがる大きな取り組みでご苦労も多かったのではと推測しています。プロジェクトの現在までを振り返って、よかったことや課題教えてください。

小松:まず現在の展開状況としては、レポート、CWH・DM作成者600〜700名くらいのうち、10〜20%に利用いただいている状態で、常時利用してくれるコアユーザーは70名くらいです。私の感覚値ではコアユーザー100名くらいを想定していたので、順調に展開できているなと感じています。

その中で、まだレベル1の段階ではあるものの、展開後に嬉しい声を一定もらえているのは良かったなと思います。特にCWHやDMなど元データを作る方達から「SQLを調べる時間が削減できた」という声があったり、レポート利用者からも「情報検索が楽になった」と言ってもらえたり。

とはいえ、いくつか要望も出ているので、クリアしていきたいですね。直近の課題としては、項目定義の明確化に取り組みたいと思っています。

 

李:そうですね。例えば「応募者数」という項目で検索をかけたとして、ヒットした「応募者数」がどう集計された数字なのか、自分の知りたい数値なのかどうかは、現状では実際にデータの中身を見ないと判断できないんですよね。この点を早く解決したいですが、事業現場の目的や要望に合致した数字を作り込むためには、ヒアリングや集計方法の検討に時間を要することも事実です。

大切な課題なのでしっかりと取り組んでいきたいです。

 

――現場の声も掬い上げて丁寧に進めることで、より精度が高くなっていくのですね。それでは最後に、プロジェクトの今後の思いをそれぞれお聞かせいただけますか?

李:BI環境で使っているデータはパーソルキャリアの大切な資産なので、それを最大限に活用し顧客や会社への貢献につなげたいと思っています。例えばデータカタログが整備されれば、別で進行しているAIのプロジェクトで使えるデータも増え、AI活用の正確性も高くなるはずです。

今回小松さんが適切なステップ設計をしてくださったおかげで、ユーザーによりBIを使ってもらえるベースができたので、今後データ活用につなげていけるよう更なる整備を頑張っていきたいです。

2名の対談写真

――ありがとうございます。小松さんからも、お願いいたします。

小松:今回はまず、情報の可視化をした上で、その可視化された情報を綺麗な形にしていく、という流れの第一段階としてデータカタログを作りました。

今後さらに情報を精査・追加していき、「この指標はこのレポートでまかなえるから、新しく作成する必要がない」など事業現場での作業工数削減のきっかけとなるように、そして、現場が本来時間をかけるべきところに注力いただけるようにしていきたいと思っています。またスピーディな事業判断や経営判断の材料としてレポートをたくさん活用してもらる状態を、理想として見据えています。理想の最終形にたどり着くには時間がかかると思いますが、頑張っていきたいと思います。

――この先よりBI活用が進んでいくイメージが持てました!ステキなお話をありがとうございました!

(取材=伊藤秋廣(エーアイプロダクション)/文=永田遥奈/撮影=古宮こうき)

alt

小松 一也 Kazuya Komatsu

テクノロジー本部 インフラ基盤統括部 データ共通BITA部 リードエンジニア

前職で10年、Power BIを含めたBIツールの技術営業として、法人顧客のBI活用の支援(レポート開発・開発レクチャー・セミナー講師等)に従事。2018年パーソルキャリア株式会社に中途入社。データ共通BITA部に配属され、パーソルキャリア全体のデータ活用リテラシー向上のため、主に各事業部の企画部門に対し、BI活用支援(レポート開発・開発レクチャー・セミナー講師等)を行っている。

alt

李 丞容 Seungyong LEE

テクノロジー本部 インフラ基盤統括部 データ共通BITA部 エンジニア

BIインテグレーションベンダーでBIシステム開発に従事。2020年3月にパーソルキャリア株式会社に中途入社。データ共通BITA部にてBI関連ではPowerBIレポート開発支援、AI関連ではDataRobotの案件化でデータ活用支援を担う。

※2021年7月現在の情報です。