未経験中途がデータエンジニアを目指す話

はじめに

2024年1月にFLINTERS BASEに入社し、3ヶ月の研修が終了したので、

その感想を本記事で共有させていただきます。

 

成長できたこと

自走力がついた

この3ヶ月間の研修は「自走式」のものでした。

要約すると、「この日にこの研修を終えましょう」という進め方ではなく、「各自のペースで進める」研修スタイルです。

元々の知識や経験がある同期の進みが早くてどうしよう!と思った時期もありましたが、自分の理解や知識の落とし込みを最優先することを常に意識して、とにかくマイペースに進めました。

マイペースということは、

・自分が苦手に感じる部分は時間をかけて学習したり、

・反対に、得意に感じる・とっつきやすいものはスピーディーに学習したり、

・「あの研修をもう一回復習しとこう!」のタイミングも

全て個人の自由です。

「自由とは自分で責任を負うこと」というフレーズをどこかで聞いたことがありますが

その通りだと感じました。ダラダラやるのとは訳が違いますので、自分自身で得手不得手を見極めてスケジューリングしていく楽しさ・責任感がありました。(もちろん終了目安の模範スケジュールは用意されています!その中でうまく自分なりに研修を走り抜けました。)

内容を理解して確実にスキルにする力がついた

個人的なお話ですが、私は結構「せっかち」です。

今まで学生の頃の勉強や受験勉強も、ただ漠然と暗記したり、抽象的な理解の仕方をして「ノリで解こう!」であったり、とにかくスピード感と効率だけを重視していました。

 

昨年、SQLの独学をしてORACLE Silver SQLの資格勉強をした時に、「これ、感覚的な学習の仕方ではいけないな」と思ったのをきっかけに、今後は何かを学習する際には1つ1つを具体的に理解して確実にスキルにしようと強く思ったのを今でも覚えています。

本研修では、そのことを一番意識しており、小さな疑問でも積極的に質問することを心がけました。そうすることで、内容を具体的に理解しスキルとして落とし込めていったように思います。

プラスアルファですが、内容をしっかり理解していると、エラーが出た時などに調べるときも、ワード選定や調べ方に関して圧倒的に時間短縮になりました!

また一つ成長したなと強く感じました。

研修内容について

どの研修も充実していて本当は全ての紹介と感想を共有したいのですが、あまりにも私の話が長いと皆さんを退屈させてしまうかもしれません。

今回は、個人的に「紹介したい研修3選」を発信させてください。

SQL基礎

SQLとは、Structured Query Languageのことで、RDBMSにおける標準言語のことです。要するに、データベースに対してデータの検索・更新・削除などを行うことのできる言語です。

「クエリ」と呼ばれる命令文のようなものでデータベースに対して、「あれしてねこれしてね〜」と指示を出すイメージです。

学習内容

・データベースとDBMS

・RDBとテーブルの構造

・SQLとクエリ

・DDL、DML、DCL

・サブクエリ

・トランザクション

・正規化理論

感想

私がデータエンジニアを目指したきっかけの1つに「SQLが好きだから」がありました。なのでSQLの研修は、正直始まる前から楽しみにしていました。SQL研修にも基礎・応用があるのですが、基礎の方では「データベースについて、SQLについての概要」を学習後に、様々なクエリの書き方・構文を学習できます。

研修を進めている際合間に何回もクエリの実行順序の確認ができる表が出てきて、記憶に残しやすかったです。

何より、豊富な演習問題!自分でクエリを考えて実行結果が求めていたものと異なったとしても、実際の動きを体感することができるので「何をしてもスキルになるな〜!」と思いました。

コンテナとDocker

コンテナとは、「アプリケーションの動作環境を仮想的に構築する技術」です。

コンテナという箱のようなものに、アプリの動作に必要なものがパッケージングされています。このコンテナ自体は、例えホストのOSが異なろうとも、関係なしに同じ動きをしてくれるので、自由に移動できる優れものなのです。

また、コンテナは同じPC上に複数作成して実行でき、コンテナ同士が互いに影響を与えることは一切ないです。

学習内容

・コンテナ概要

・コンテナを使ってみる

・コンテナイメージの作成・共有

・Docker Compose

・コンテナオーケストレーション

感想

まず最初にお伝えします。この研修が私にとって一番難しく、本当に苦手でした。

楽しかった・面白かった研修以外にも、苦手なものはどう乗り越えたかを知っていただくためにあえて「紹介したい研修3選」にコンテナ研修を組み込みました。

 

目に見えないコンテナをコマンドで操る・・・一体どう動いているのか、何が変化したのか、データの存在は何処に・・・

など、とにかく「ぼんやりとした理解」をしたのが最初にコンテナ研修を終えた時です。

ただ、研修資料に関しては非常に分かりやすいのです。

つまり、点と点で知識をつけることは出来たものの、自分の頭の中でそれらを線として繋いで想像することが私には出来ていなかったということです。

コンテナ研修終了後も他の研修を進めていく中で、コンテナ環境で行う研修もあり、私の場合使いながら、「ぼんやりとした理解」の縁取りを進めていったような感覚です。

それに加えて、

・社内の書籍を借りられるシステムを利用して本を借りてみる

・研修を終えて希望があれば補講を開催してもらえるので、コンテナ研修の補講の希望を出した(補講は全研修終了後に自分で希望のものをリクエストできます)

といったことをして、理解を深めました。

BI可視化

BI可視化の研修はTableauというツールを使用して学習します。

(GCPの研修内では、Looker Studioというツールを触って可視化を行う箇所もあります。)

まず、BIとはBusiness Interigenceの略でビジネスで得られるデータを集計・分析・予測するプロセスのことです。

集計・分析・予測したいデータをTableauに取り込み、ワークシートというものにグラフや散布図などを作成し、ダッシュボードというものに複数のワークシートを配置します。

作成されたダッシュボードをもとに、データアナリストやマーケターの方が分析を行うのです。

学習内容

・BIツールとは

・Tableauを使ってみよう

:グラフ・散布図・ツリーマップ・テキストテーブル・地図の作成

:データの結合・抽出・型変更・条件の絞り込み

:簡易計算表の使用

:LOD式(FIXEDとINCLUDE)の使用

:演習

感想

BIツールというものをこの人生で初めて使用しました。

演習では自分の興味のあるデータセットを使用して、「アメリカのAirbnbの分析」を行いました。

自分が分析してみたい項目に対して、どのグラフが適しているか、視覚的にどのような情報を表示させるか、何を条件として絞り込むかなどを試行錯誤しながら作成するのは非常に面白かったです。

ただデータベースにずらりと並んだデータも、可視化を行うことでこんなにも直感的にわかりやすく扱うことができることが感動でした。

「百聞は一見に如かず」とはまさにこのことですね。

会社に入ってみての感想・雰囲気について

質問できる環境・回答だけで終わらない環境のありがたさ

「15分間自力で調べて考えてわからないことは質問する」というルールがあり、質問自体はSlackを使用して簡単に行うことができる環境です。

文章のみで解決できないことはGoogle Meetを繋いで画面共有をしつつ一緒に解決策を導いてくれます。

これだけでも十分ありがたいのですが、教育部の方たちは必ず「回答するだけ」ではないのです。いつも「解決に導くためのヒント」を提案してくださるので、

・なぜそのようなエラーが出て、

・何が原因だからこういう解決策をとってみた

という流れを能動的に行うことができ、より理解が深まります。

また、中間演習という演習では「ペアプロ」と呼ばれる「Pythonならなんでもお任せあれ!」の先輩社員に1対1で30分間好きに質問することができる時間もあります。

非常に有意義な時間と恵まれた環境であったと感じます。

人のよさ

上記でお話ししたことも含め、とにかく人がいいです!

皆さん優しくて、なんでも聞いてねと気にかけてくださるんです。教育部の方以外にも、現場に出ている先輩方、グループのFLINTERSの方、そして同期。皆さんがいたからこそ乗り越えられた研修だと心から思います。

これからの抱負

最後になりますが、私の今後の抱負を発表して終わりとさせていただきます。

気軽に頼れるエンジニア

誰からも、話しかけやすい・相談しやすいエンジニアを目指します。

能動的・積極的に行動

自ら学び・考え・動くことを自分の中で大切な考えとしているので、常に意識して今後のデータエンジニアとしての人生にも取り込みます。