【目指せデータサイエンティスト】未経験でどうやって実力を証明するの??

何の記事??

データサイエンティストは、「21世期最もセクシーな職業」と言われており、非常に人気の高い職業です。

ですが、現在のデータサイエンティストを見る限り「MBA取得者」「有名大学院卒業」などとても敷居が高く感じます。

そこで、この記事では上記のような箔はないけど本気で「データサイエンティスト」になりたい!という方向けにどのように実力を証明するのかを説明していきます。

f:id:shaw522:20200510194238j:plain

本記事の対象者

  • Python を勉強しているがこの先どう活かせるのか悩んでいる方
  • 未経験からデータサイエンティストを目指している方
  • データサイエンティストを目指すのに何から手をつけて良いのか分からない方
  • 現役エンジニアでデータサイエンティストにキャリアチェンジを考えている方

データサイエンティストとは

一般社団法人データサイエンティスト協会は、「データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」と定義づけています。

つまり、改めて纏めるとデータを分析し今まで見つけ出せなかった事実を見つけ出すことでビジネス課題の答えを生み出す職業ということですね。

なぜ今注目されているのか?

上記の定義だけを見ると、マーケティングなどで元々あった職業では?と思われる方がいるかと思います。

そこで、なぜ今「データサイエンティスト」が注目されているのかに注目してみましょう。

データを分析するには大量のデータ(ビッグデータと呼ばれます)が必要となります。
近年、センサーや通信機器、さらにはネットワービスが非常に普及してきており ECサイトなどのデジタル領域だけではなく、リアルの場からもデータが取れるようになってきました。

そのためビッグデータを集めやすくなっただけでなく、クラウドの普及によりデータを処理するのに必要な高スペックなサーバーを気軽に使えるようになりました。

このような背景を踏まえてデータを分析しビジネスを加速させる職業「データサイエンティスト」が重要視されるようになりました。

データサイエンティストに必要な能力

それではデータサイエンティストに必要な能力を説明していきます。

データ分析手法(プログラミングやツール)

当然ですが、データを分析するための手法をスキルとして持っている必要があります。
この時真っ先にプログラミングだと言われることもありますが、この世には非常に多くの分析ツールが出ています。

例えば BIツールや、Excel であってもデータの分析はできます。

もちろん最終的にはプログラミングができるようになっておいた方が良いのですが、男女比率を出すためだけに何もプログラミングで集計する必要はありませんよね。

今ご自身が使えるツールの中でデータ分析に使えるものはないのか?(ご自身が既にスキルとして持っているものがないのかを振り返ってみてください)

データ分析 = プログラミングというのは危険だと感じています。

ビッグデータの取り扱い

先ほどプログラミングだけではないと記載しましたが最終的にはプログラムを書くことになります。

プログラムを書く時に文法などを学ばれる方は多くてもデータの取り扱いの学習をされている方が非常に少ないというのが印象です。

ビッグデータにはビッグデータなりの取り扱い方がありますので、是非学習してみてください。

こちらの本が非常に丁寧に説明されています。

統計学

次に統計学です。
データを分析するにもその分析手法や検定方法がわかっていないと「今まで見つけられなかった事実」を見つけ出すという本当の価値は発揮できません。

実際には例えば分散であったりのある程度の値は Python のメソッドで導き出すことができますが、それが意味する値を理解できていないと意味がありません。

統計学を全くやったことがない人であれば、以下の本がオススメです。

ビジネスの理解

ビジネスの理解」はおろそかにされがちですが、面接では自分の魅力を伝えられるところだと思っています。

特に未経験で全くIT業界ではないところからの転職を目指す方!!
実はものすごく武器になるんです。

転職者に期待することは「新しい風を社内にもたらしてくれること」です。

未経験であっても元々の営業職なのか運転手なのか料理人なのか、なんであってもプロフェッショナルとして仕事をしてきているわけです。

そのため元〇〇の私だからこそ出来るデータ分析の軸というのは大切になってきます。

解析しようとしている業界や事業についての知識や知見、トレンドなどの情報というのはドメイン知識と呼ばれ非常に大切なものです。

実力の示し方

やっと本題に入ります笑

先ほど説明したビジネスの理解については、面接などでの自分を採用することのメリットとなりますが、それ以外の方法を紹介します。

それはずばり・・・資格とデータ分析コンペです!!

資格

統計検定

統計学の必要性は先ほど記載したとおりで、やはり統計の知見があることは資格で証明することができます。

履歴書には統計検定2級から書いても良いでしょう。

非常に良いサイトがあり、合格体験談でも多くこのサイトが紹介されています。

bellcurve.jp

クラウドの資格

統計知識だけでなくエンジニアリング力も証明したいのであればクラウドの資格は圧倒的に有利です。

ただしこれらの資格は非常に難しいため持っていないことが採用の障壁になるとは考えづらいです。
しかし、ビッグデータをクラウドで取り扱う勉強として一度教本を読むくらいはしても良いのかなぁと思っています。

参考までにビッグデータ向けの資格を紹介します。

Google が出す Google Cloud Platform(以下 GCP)や Amazon が出す AWS が有名です。

◾️Professional Data Engineer(GCP)

cloud.google.com

◾️AWS認定ビッグデータ(AWS)

aws.amazon.com

Python資格

データ分析資格として、「Python 3 エンジニア認定データ分析試験」があります。

データサイエンティストとして転職する場合、Python の知識は習得しておきたいところです。

また、この後で紹介するデータ分析コンペに参加するに当たってもこの資格に合格するくらいの実力はつけておきましょう!

以下は Python 初学者からこの資格に合格する実力をつけるのにおすすめの本です。

データ分析コンペ

データ分析コンペを3つ紹介しますが、どれもトップクラスの成績をおさめていなくても挑戦し、自分で結果の提出までいくことが大切だと思っています。

懸賞金取れるほど優秀ではないから言わない・・・ではなく、挑戦したコンペについては積極的にアピールするポイントになると思います。

Kaggle

一つ目は世界的に有名なデータ分析コンペ「Kaggle」です。

www.kaggle.com

Kaggle は様々な企業がデータセットを公開しているだけあり懸賞金がかかっているものもあります。

Kaggle のコンペに積極的に参加したり自分の分析を公開している人のことを Kaggler と呼ばれ、面接官も Kaggler だったらとてもラッキーですね。
このように、Kaggleで結果を残すことはデータサイエンティストの実力を証明するものとなります。

また kaggle については非常に多くの本が出ています。

SIGNATE

次は日本で主流なデータ分析コンペ「SIGNATE」です。

https://signate.jp

先ほど説明した Kaggle は英語なのでちょっと・・・という方は SIGNATE をおすすめします。

SIGNATE では SIGNATE Career というデータサイエンティスト・AIエンジニアに特化したキャリア情報サイトを運営しているところも転職希望者としてはモチベーションが維持しやすいですよね。

career.signate.jp

Nishila

最後に紹介するコンペは「Nishika」です。

www.nishika.com

Nishika もSIGNATE 同様、日本語で展開されているデータ分析コンペです。
さらに 2020年6月頃には転職サービスも連携するようなので期待大です!

www.nishika.com

Nishika で忘れてはいけないのは、AI・データ分析に特化した QAサイトです。
質問とその回答を見るだけでも十分参考になりますので、コンペ参加の際は是非参考にしてみてくださいね。

www.nishika.com

宣伝

現在未経験者を含むエンジニアへのキャリアチェンジを目指している方をメンターとしてサポートしています。

まずは疑問やマッチするかなどお気軽にご相談くださいね。

menta.work

twitter もチェックしてもらえると嬉しいです!!

https://twitter.com/Jakunan522twitter.com

最後に

データサイエンティストは、非常に魅力的な職業である反面、敷居も高く感じますよね。
やはり現状としては、スキルの非常に高い専門的な職業であるがゆえにプログラミングなどにばかり目がいきがちですが、ご自身の強みを活かした転職ができると自ずと結果がついてくるかなと思っています。