初心者からの挑戦！データサイエンス研修日記

皆さんはじめまして！今年4月にデジタルテクノロジー統括部へ新卒入社した長谷川智彦です。

デジタルテクノロジー統括部では昨年から新卒採用をスタートし、僕ともう1名の計2名が晴れて入社しました！

今回の企画はそんな僕らの学びの過程を外部に発信していこうと思っています。

長谷川智彦のプロフィール

大学時代の専攻は植物学・分子生物学。最近趣味でデザインをかじり出した社会人1年目。植物の実験データを正しく解釈するために統計を勉強し始め、データ分析に興味をもつ。データサイエンスはただいま必死に勉強中。

▼研修開始時点でのデータサイエンスの実力

内定をもらってから研究の合間時間で機械学習や統計の基礎知識を勉強していたレベル（はじパタや統計検定2級レベルの知識）。プログラミングはProgateでPython、SQL等の基礎文法を学んだ後、データサイエンティストになりたい人向けの本でNumpyやPandasの基本的な使い方や機械学習のライブラリの使い方を写経しながらやったことがある程度のレベル。ほぼ初心者です。

▼こんな方々におススメの記事にしたい！

データサイエンス未経験の新卒を育成している方
データサイエンスの経験問わず、パーソルキャリアでデータサイエンス周りの仕事に就きたいと考えている方
デジタルテクノロジー統括部の取り組みを知りたい社内他部署のみなさま

デジタルテクノロジー統括部の新卒データサイエンティスト研修とはーーー

この記事では、僕たちが配属してから最初に出された研修課題の1つを紹介します。

期間はだいたい3週間。以下の課題に挑戦しました。

＜課題＞

Udemyで提供されている『【世界で18万人が受講】実践Python データサイエンス』とProgateのSQLのコースを行った後、KaggleのTitanicコンペに挑戦！

＜目的＞

構造化されているデータに対してPython ライブラリのNumpy, Pandas, Matplotlib などを使用した分析を行えるようになる。

他の研修課題もあったので意外と予定がパンパンになりましたが、研修内容を実際に行った感想などをこれから書いていきます！

Udemyなどのオンライン教材を使用してみて――

最近聞かないことがないくらいビックデータやAIが注目されています。データサイエンティストを目指す方やデータ分析に関して学んでみたい方向けのオンラインサービスも増えてきてます。デジタルテクノロジー統括部の研修ではその中でも様々な講座をオンライン動画で見れるUdemyからPython入門コースとプログラミング初心者の向けに実際にコードを記述しながらプログラミングを学べるProgate からSQLのコースを扱いました。

では実際にこれらのオンライン講座を僕がやってみた感想を伝えるとこんな感じです。

Udemy：自分で少しやっていたのでつまずかずことなく助かった！ただ、動画を見ながらコードを打つのは少しあわあわしながらになった。

Progate：スライドもついていてわかりやすい！何よりUIデザインがかわいい。

この感想を抱く理由を具体的に考えてみると、

1：Numpy、Pandas等のライブラリを触ったことがあったため、復習として行う感覚があり、改めてどんなことができるかを思い出しながらJupyter notebookにメモとして残していけたことが挙げられます。全くプログラミングに触れたことがなかった頃の自分では3週間の期間で理解できたとしても、実際に慣れて使えるようになるまでには短すぎたと感じます。

2：Progateはやったことがあったのですが、それでもレクチャーの初めにスライドで視覚的にわかりやすく説明してもらえながら進めていけるのでやりやすいと感じました。（特にターミナルやテキストエディターとは？となる方でも気兼ねなく始めれると思います。）

ひとまず、PythonとSQLの基本を学ぶためのオンライン講座の感想は復習するのにちょうどよかったという感じでした！（Pythonまだ触ったことないレベルの方だと3週間は習得にはかなり厳しいとも感じます。逆にインターンなどでデータ分析の経験がある方には物足りないと感じます。）