こんにちは。2024年4月に新卒でデータサイエンティストとして入社した辻です。
就職活動の際にはtechtektのデータサイエンティストの記事を読み漁っていました。社員の多様な思いや学び、取り組みが紹介されていて、とてもわくわくしたのを覚えています。
入社してからは、日々の業務に追われ、大学時代に培った興味や関心をしばらく放置していました。しかし、私が所属するグループでは、部内の勉強会や自主研究が盛んで、学会に参加したり発表したりするメンバーも多くいます。そんな環境に触発され、私も自分の興味をうまく日々の業務に取り入れていきたいと感じるようになりました。
というわけで今回、この寄稿に挑戦してみることにしました。
第1回目となる今回は、自己紹介を兼ねて、大学院での研究から現在の業務をざっくりお話しします。
次回以降は、業務を通じて得た学びや疑問、そして先輩から提供された話題をもとに、言語や思考に関する小話をお届けする予定です。
これらの記事を通じて、データサイエンティストという職種が難しいけれども学びの多い面白い職種であること、そしてパーソルキャリアでは多様な人材が活躍していることをお伝えできればと思います。成長物語として読んでいただけると嬉しいです。
執筆者のプロフィール
まずは私の自己紹介として、大学院時代の研究と、データサイエンスの実力について紹介したいと思います。
私は修士課程まで認知心理学を専攻し、人間を対象にした行動実験を通して、身体や行為と記憶の関係について研究していました。先行研究や自分の研究から得られた知見をもとに新たな理論を構築していく過程は非常に楽しいものでしたが、思うような結果が得られず、研究に行き詰まることもしばしば。そこで、別の手法や領域に触れてみたいと考え、博士進学ではなく就職の道を選びました。
パーソルキャリアに就職を決めた理由は、いくつかの魅力的なポイントがあったからです。まず、データサイエンティストとしてスキルを磨いていけること。そして、分析対象が人に関わるものであること。さらに、リモートワークが可能であること。最後に、アカデミックな背景を持つ人が多いという点も大きな魅力でした。
データサイエンスのスキル
入社時点での私のデータサイエンスの実力は、研究でデータ分析や実験プログラムを作成する際に使用する程度のもので、教科書レベルのRとPythonの知識しかありませんでした。そのため、入社後の半年間は勉強の日々が続きました。
まず、Pythonについては「データサイエンス100本ノック」に取り組み、操作に慣れることから始めました。また、研修を通じて機械学習と深層学習について学びました。データベースを操作するためのSQLについても、「100本ノック」や社内のデータ構造に関する問題集を解きながら習得しています。
さらに、開発に必要なシェルコマンドや仮想環境、Gitなどの知識、クラウドコンピューティングサービス、オブジェクト指向についても、入社後に実践しながら学びました。
なお、先輩方が取り組んでいた歴代の研修については、テックテクトの「データサイエンティストのたまご育成日記」、「てくてく目指すデータサイエンティスト」、「新卒データサイエンティストの成長ストーリー」をご覧いただければと思います。私はテクノロジー本部のデータサイエンティストにおける新卒採用の4代目にあたりますが、研修内容は毎年変わっており、きっと来年度もまた新たな内容になることでしょう。
どんなプロジェクトをやっているかの紹介
10月に正式にプロジェクトアサインされてから
- キーワードを入力すると職務経歴書を作成する大規模言語モデル(LLM)の技術検証
- 職務経歴書から逆に重要なキーワードをピックアップする機能の研究開発
- パーソルキャリア版生成AI「ChatPCA」の利用状況の分析
等を行っています。
これらのプロジェクトでは、どうやって文章を生成させるのか、文章中の重要な単語をどのように判断させるのか、そして指示に沿った生成をどのように実現するのかといった課題に取り組んでいます。大規模言語モデルは今まさにトレンドとなっていますが、私にとっては全く新しい領域であり、毎日多くのことを調べながらなんとか作り上げている日々です。
自分の研究領域と業務との接続
自分がやっていた認知心理学、全然今の業務と接続していないなと思っていたある日、yyt2先輩が面白い話を聞かせてくれます。
「LLMに関連する確率・予測・情報の圧縮ってキーワード、人間の記憶構造とか言語の習得でも出てくるよね」
心理学と近いけれども馴染みのなかった進化言語学や情報工学との出会いです。
ということで、次回からは、毎日の業務で全力疾走している中での苦労や失敗談ではなく、業務で扱っているトピックに関してちょっと寄り道した小話をお届けしたいと思います。
辻 菜々実 Nanami Tsuji
デジタルテクノロジー統括部 データサイエンス部 アナリティクスグループ
大学院時代は認知心理学を専攻。2024年に新卒入社し、主にLLMや生成AIに関するプロジェクトに参加。最近はホールディングスで開催されたUXデザイン講座に参加し最終課題に合格しました。
※2025年3月現在の情報です。