Ebitia's Log

技術的なことや考えたことを雑につぶやいていきたいブログ

情報学専攻でない学生がデータサイエンティストを夢見た話

1.はじめに

「情報系学部出身じゃないけどデータサイエンティストに興味がある...」

この記事はそういった就活中の学生に向けて書いています。備忘録も兼ねたポエムのようなものですね。

私自身は医療系の学生で、研究で少し機械学習を扱ってはいましたが、情報学の専攻などを一切してきませんでした。就活中の区分としてはただの理系学生としての扱いです。

そんな私がどうしてデータサイエンティストを目指したのか?そしてどうなったのか?


結論から言うと、私はなれませんでした。


なのでここからは敗北者の記録です。

ですが、「情報系でないならデータサイエンティストはやめておけ」といった内容ではありません。
どうか私の夢の跡地で、そこまで甘くない現実と「何が足りなかったのか」を参考にしてくれる誰かがいたらうれしいです。

2.本編

2-1.どうしてデータサイエンティストを目指したのか?

私は前述のとおり情報学の専攻ではありませんでした。

そんな私がデータ分析といったものに初めてであったのは研究室に配属されてからです。
研究室に配属された私は、研究テーマの専攻の時に、「医療データに対して機械学習をつかってゴニョゴニョ...」といったような内容に割り振られました。

まあくじ引きのようなものでした。今振り返ると幸運だったとは思います。

そこから研究を進める中で、統計や機械学習といったものを学びました。そこからですね、機械学習といったものにハマり、だんだん研究以外の勉強・活動を行うようになりました。。

connpassのイベントに参加したり、TwitterでMLに強い人をがんがんフォロー(有益な情報流れてくるので馬鹿にできない...)したり、時にはLTしたりしました。他には、オライリーの本買って勉強したり、公開されてるモデル使って遊んでみたり,,,あとはKaggleとかもちょっとやりました(実力不足で賞は取れなかったんですが、、)

そんな生活を送る中で、就活の時期がやってきます。 こんな感じにデータ分析・機械学習にハマっていった私は、これを仕事にしたいな...と感じるようになりました。

2-2.応募フェーズ

さて、就活しようぜ!となったわけですが、 周りに同種の職を目指している人はいないので情報はありません。さっぱりです。

しょうがないので自分の周辺ではスタンダードなリクナビで検索しました...が、正直パッとした求人がありません。なかには、これはデータサイエンティスト詐欺では...?といった求人も多くありました。一瞬で辞めました。

次にやった方法は、dodaなどの転職サイトで"データサイエンティスト"や"機械学習"といったワードで中途採用の検索をかけることです。

中途で経験あり募集してるなら部署として成り立っていてある程度ホットだろといった寸法です。個人的には良い方法だったと思ってます。
そこで引っかかった企業で扱ってるデータなどに興味がわいた新卒募集を見て応募していきました。有名どこだと某R社とか某B社とかですね。

この時感じたのは、データサイエンティスト職のインターン募集してる企業は結構あるな~ということです。

私は授業とモロかぶりするので無理ーーー!!となったんですが、未経験の学生はここからjoinするのがベストかもしれません。

2-3.選考1次フェーズ

さて、選考に移るわけですが、私にとって一番のネックとなるのがスキル・経験です。
経験面では、

Pythonなどを用いた機械学習の経験 >= ②統計知識 > ③データベースの経験 > ④クラウド経験

といった順で求められているものが多かったです。 私はこの時点では、一応③まではある感じでした(経験は少ないですが...)

研究などで触れてない人は、Kaggleの経験でもOK!とうたっているとこも多かったです。
ですが、最近はデータサイエンス学部なんてものもありますし、分野としても流行ってるので私のように研究で少しでも扱ってる学生はあふれかえっていると思います。
非情報系の学生はこの壁をどう乗り越えるかが鬼門だと感じました。Kaggleは偉大なり、です。

さて、これを埋めることができた私に、次の関門が押し寄せます。コード選考です。

ない企業もありましたが、一部の企業ではプログラミング選考を設けているところもありました。研究室でPythonを触ってはいましたが、アルゴリズムなどはさっぱりな私がそのままでは受かるはずもありません。
なので、AtCoderというサイトに登録して問題を解いたりコンテストに出たりして勉強しました。

これらの努力が功を奏したのか、応募した企業はどれも書類・テストについてはパスして選考に進むことができました。

2-4.選考2次フェーズ

さて、ここが私にとっての絶望のステップとなりました。面接です。

個人的にそこまでコミュ力不足など感じたことなかったので(本当か...?)、最初はそこまで悲観してはいませんでした。
どの企業も2次であったり最終選考までは進んでいきます。サクサクです。


我が世の春が来た...!!と思ってました。ここまでは。


しかし、この後に進むことはありませんでした。。 面接で落ちたところ、今年のデータサイエンティスト定員に達したところ。。

悲しいことに、どこも通ることはありませんでした。。 データ分析にたずさわりたかったな。。。かなしいな。。ぼうけんはここまでのようだ。。

2-5.就活の結末

私の就活の結末としては、ほかにも応募していたIT系企業にエンジニアとして内定をもらいました。

こちらにも興味があったのでまあよかったのです。 ,,,が、結局データ分析に携わりたかったという思いもまた事実です。

3.どうすればよかったのか?

さて、私の敗北体験記はここまでです。

ここからは、少し振り返りをしていこうと思います。誰かの参考になってくれたらうれしいです。
自分の就活でたぶんいけなかったことは、この3つです。

・就活をはじめるのが遅かった
・実績・スキルが不足していた
人間性が不足していた

3-1.就活をはじめるのが遅かった

自分は研究室に配属されて、研究をやって、勉強して、全部が落ち着いてから就活を始めました。なので、本格的にはじめたのは2月からになります。 まあ時期的にコロナがもろ直撃したわけですが、こちらに関しては面接がWeb対応になったくらいでしょうか...?私の選考結果にそこまで影響したものではないと思ってます。

このように春から選考スタートしたわけですが、データサイエンティストインターンなどを募集してる企業は、夏ごろから募集してます。これに参加する時間があればベストだったでしょう(学校スケジュール的に無理でしたが...)。
可能であれば参加したほうがいいと思います。
それができなくても、秋ごろから採用募集してる企業もあるのでそういったところに応募すればよかったですね。

この時期(4月~)になってくると、新卒採用数の調整に入るところもあると思います。
そんな中で最終選考に同じくらいのやるきMAXな2人だけど、ひとりは情報系の研究で機械学習バリバリの学生。もうひとりは他理系で少し機械学習経験が薄い学生。。。あなたならどっちを採用しますか?

3-2.実績・スキルが不足していた

自分にとって弱かったところです。「医療系の研究で機械学習、データ分析を一生懸命やりました!他にも勉強してます!」とは言いましたが、やはり学会での発表であったり論文誌への掲載があればよかったでしょう。まあ時期的に難しかったわけですが(甘え)。。。

それでも補う方法はあります。Kaggleの受賞歴などですね。これはこの分野の就活で大きく効くものだと思います。
なのでコンペにもっと時間を割いて、数も出ればよかったな...と思ってます。かなり大きな反省点です。

スキルに関しては独学でつぎはぎな部分だらけだったと感じています。まだ仕事で使えるレベルでは当然ないでしょう。 しかし、企業にもよると思いますが新卒募集に限れば求められるスキル要件などは最低限クリアするものであったのかな...?とは感じています。

もちろん最低限のレベルにすぎないので、選考でプラスになるほどではなかったと思います。
ここに関しては、自分の割けるmaxに近いリソースで取り組んできたので、選考時点でこれ以上を目指すのは難しかったと思います。 しいて言えば、Webアプリの開発経験などがあればより良かったのかとは思います。

スキルが今低いのはもはや仕方のないことです。努力不足ですね。
受け入れて一歩一歩精進していくしかありませんね、これからも。

3-3.人間性が不足していた

もうこればっかりはね...どうしようもないと思ってます。
だってこういう人間なんだもの...

でも自分の中では面接に落ちた理由の最有力候補です。だってある程度まで選考進めたわけですからね。。
まあこれはどうしようもない。嘘ついてまで受かろうとも思いませんし。

なので、ほかの候補者と比較したときに人間性の不足を補うだけの能力がなかったor示せなかったのが今回の敗因だと思ってます。

4.最後に

さて、こんなおきもちポエムをここまで読んでくださりありがとうございます。 所詮ポエムなので、楽しんでいただけたなら何よりです。

そんなこんなで1エンジニアとしての生を歩みそうな私ですが、もしかしたらデータ分析の仕事に関わる機会もあるかもしれません。未来のことは解りませんが、技術力を高める活動やら機械学習の勉強は好きなのでずっと続けていくんだと思います。たとえ仕事が関係なくとも。

ですがこんな記事に辿り着いた「情報系でないけどデータサイエンティストになりたい!」というあなたにはこの道への興味や夢があるんだと思います。

「データサイエンティストなら文系新卒でも年収1,000万!」「今世紀最もセクシーな職業!」「AI人材不足なので誰でも受かる!」と巷で謳われていますが、そこまで甘くてキラキラした職業ではないと思います。

また、このコロナ情勢でAI関連の分野への投資もある程度は減るだろうという苦い近況もあります。


ですが、それならやめておこう。どうせ情報系でないと無理なんでしょ?と夢をあきらめないでください。 私なんかでも選考を進めることはできたので可能性は0ではありません。

ぜひ私の失敗を踏みつけて先に進んでください。
私よりも能力があるあなたならきっとできます。

ブログはじめました

自己紹介

はじめまして。エビティアといいます。 医療系の学部で学生やっています。

研究室で機械学習に触れて、今は医療文書にたいして自然言語処理ごにょごにょするような内容を扱ってます。

Qiitaとかにはたまに投稿してますが、そこに投稿できないポエミーなことや技術的な取り組みなどを載せていけたらと思います。

最近のあれこれ

最近はAtcoder、Kaggleに触れて「うわ...私の技術力、低すぎ...?」と心ポッキーになる日々を過ごしてます。力が足りないよ、力が!

まあ原因は明らかですね、大学で特に専攻していなかったのと、根本的な数学力が欠如してます。


あとは一応医療系学部なので来年には国家試験があります。あるよね...?あるはずです(多分)。 コロナの影響でどうなるかわかりませんが、消滅してしまったらその時はその時です。

うちの学校も休校になり、授業はどこかへ消えてなくなってしまいました。今は高い学費が虚無に葬られるさまを眺めるだけの謎の機関に所属している...

これからの目標

技術力アップとモチベーション維持のためにも当面の目標は週一ペースで記事を投稿することをめどにやっていけたらと思います。