元非破壊検査員のデータエンジニアへの研修記録

はじめに


2023年7月に入社の桑野です。

入社後の3ヶ月間の研修が終了したので、その感想を共有させていただきます。

同様のエンジニア志望の方にとって参考になれば幸いです。

経歴

前職は、工場やプラントでの検査を行う、非破壊検査員として働いていました。

その中で、報告書の作成効率改善の為Excelのマクロを勉強し始めたことを切っ掛けに、エンジニアを目指すようになりました。

プログラミングスクールに通い転職活動をしていく中で、ご縁がありFLINTERS BASEに入社させていただきました。

入社が決まって行ったこと

内定をいただいた後、入社前にいくつかの学習を行いました。その経験から、やってよかったことと、もっと事前に行っておけばよかったことを紹介したいと思います。

やってよかったこと

SQL

プログラミングスクールでは、RubyのフレームワークであるRailsで各作業をしていました。

Railsを使用すると、変数名.saveという簡単な方法でデータベースにデータを保存でき、ほとんどSQLクエリに触れる機会がありませんでした。

そのため、基本的な概念と書き方を把握するために書籍を中心に学習しました。

研修ではもちろん基礎的なトピックから学びますが、事前に学習した甲斐もあり、これらの基礎をスムーズに理解できたと感じています。

データエンジニアについて調査する

データエンジニアという一般的なエンジニアとは異なる職種について、その仕事内容を理解する必要性を感じていました。

そのために、動画配信サイトにおいてデータエンジニアに関する動画を視聴したり、IT勉強会などで企業が主催するデータ分析に関するオンラインイベントに参加したりしました。

これらの情報が実際の研修で役立つこともあり、データエンジニアの職務について具体的なイメージを持つのに役立ったと感じています。

やっておけばよかったこと

ネットワークの基礎

こちらももちろん基礎的な部分から研修が用意されていましたが、これまでほとんど学習してこなかった分野であり、理解しきれなかった部分がありました。

ITパスポートや基本情報技術者試験で出てくるインターネット用語について、事前に学習しておけばよかったと感じています。

その他

その他にもPythonやGCPのサービスについて学習しましたが、これらについてはPCへの導入方法から研修が提供されることもあり、事前の準備をあまり心配せずに済むと感じました。

研修内容

SQL

SQL研修では大きく2つの部分に分かれます。最初に基礎的な操作を学び、次に応用的な書き方について学習しました。

・データベースの導入方法からテーブルの作成、更新、削除などの基本的な内容

・with句を使用したクエリの分割や、window関数など、より高度なSQL関数

ただし、学習の際に資料を読むだけでなく、ハンズオンや演習を実施し、教育担当者からのフィードバックを受けることも出来るため、徐々に理解を深めることができます。

SQLは他のサービス(例: GCPやAWS)でも使用されることから、仕事の基盤として必要なスキルを身につけることが出来たと感じています。

ETL(Digdag + Embulk)

Embulk

Embulkとはファイルやデータベース、クラウドサービス間のデータ転送を支援するサービスです。

このサービスを活用して、csvファイルをクラウドサービスにアップロードする方法について学習します。

Digdag

実際の仕事では、複数のプログラムやタスクを連続して実行したいことがあると思います。例えば、下記のような作業を行いたいとします。

  1. ファイルを探して指定した場所に移動させる(シェルコマンド)
  2. ファイルの内容を書き換える(SQL、Python)
  3. ファイルを読み込んでクラウドサービスにアップロードする(Embulk)

これらのタスクを組み合わせて実行できるのがDigdagです(同様の機能を持つAirflowについても学習します)。

入社する前は、各プログラムを連携させるためにPythonを使用すると考えていましたが、Digdagを知ることで驚きました。

実際に動作すると、データエンジニアとしてのスキルを身につけたことが実感でき、非常に感動しました。

総合演習

これまでの学習成果を活かして、Python、SQL、およびクラウドサービス(BigQuery)などを使用して成果物を作成しました。

この演習では、テーマや分析元のデータを自分で選定し作業をするので、より実務に近い形で学んだことを振り返る機会となると思います。

私はインターネット上で公開されていたピザ店の売上データを取得し、データを加工して可視化を行いました。

作成した成果物

データには文字化けや、例えば「1=晴れ」のように数字で表現されているデータなど、実務でよく見られる課題が多くあり、これらの問題を解決することが、データエンジニアとしての真価を発揮される瞬間なのだなと実感しました。

成長できたこと

ドキュメントを読む習慣が身についた

これまではエラーや不明点が発生した際、類似の問題を解決するためにブログなどから情報を探していました。しかし、最近の研修でドキュメントを積極的に参照する機会が増え、正確で理解に繋がるためにもドキュメントをしっかり読むことの重要性を認識しました。

プログラムのドキュメントには英語のものも多いですが、今後も恐れずに読み込んで問題を解決していきたいと思っています。

データエンジニアの概要と価値を理解できた

Digdagの演習にも書きましたが、個々のプログラムについては理解していても、それらをどのように連動させて動かすかが不明確な状態から、一連の処理を実行できるように成長できたことを感じています。

また、データパイプラインの構築とデータの可視化だけでなく、データの収集と処理もデータエンジニアの価値であることが理解できました。

今後もスキルの向上に努めたいと思っています。

会社に入ってみての感想・雰囲気について

コミュニケーションが活発

巷でよく聞く職業から珍しい職業(私はこちら側ですが笑)まで、幅広い経歴の方々がいらっしゃり、交流し新たな知見を得ることができる素晴らしい環境です。

また、派遣という立場で同じ配属先以外の人々との交流に不安を感じるかもしれませんが、その点は心配いりません! 異なる配属先のメンバーとも交流を深める機会が十分にあります。

オンラインを活用した2週に1度のランチ後の交流会や、配属先の業務報告会、勉強会など、積極的にコミュニケーションをとる機会が整備されています。

面談によるフォロー

研修期間中はSlackを活用して質問できるだけでなく、教育部のメンバーや既存の配属先の先輩との面談も行います。

これにより、不安や疑問点を詳細に相談できる機会が提供され、また、先輩との面談では配属先の状況について話を伺う機会があり、配属への理解を深めることができます。

これからの抱負

3ヶ月の研修を終えて、これから配属先が決まることになりますが、配属後も積極的にコミュニケーションをとることでクライアントのニーズを把握し、適切な仕事を提供できるよう努力していきたいと考えています。

また、自身が学んだ技術について積極的に共有し、スキルを高めるとともに、会社の皆さんの役に立てるような人材になることを目指して学習を続けたいと思っています。