エンジニアとはまた違うのかな。。
こんにちは、古賀です!
本記事では、
はてな
「データサイエンティストの仕事内容」
「データサイエンティストの必要スキル」
について、お話します!
最近は、
「AI」、「機械学習」、「ディープラーニング」、「ビッグデータ」・・・
という言葉をよく耳にするようになりました。
その言葉の中心で仕事をするのが「データサイエンティスト」です!
エンジニアと同様に、需要が高まってきている職種です!
今回は、その「データサイエンティスト」について解説していきます!
自己紹介が遅れましたが、
わたしは大学卒業後、上場IT企業に就職し、プログラマー、システムエンジニアとして
約10年間働いておりました。
プロフィールの詳細はこちらです。
-
プロフィール
こんにちは、古賀正雄です。現在36歳です。 簡単ではありますが、こちらのページで自己紹介とこのブログについてお話します。 高校時代 学生時代は主に野球をしていました。 進学先の高校も野球で選びました。 ...
続きを見る
※YouTubeに同内容を公開しております。
データサイエンティストとは?
はじめに「データサイエンティストとは何なのか?」について簡単にお話します!
データサイエンティストとは、
「企業内、世の中にあるデータを活用、分析を行い、企業や世の中の課題を解決する職種」
です。
現在は急速に情報化が進んでおり、毎日多くのデータが生み出されています。
その膨大な量のデータ(※ビッグデータと呼ばれています。)をうまく有効活用できないかと、
多くの企業が考えています。
そのため、その大量のデータを活用し、
ビジネスに活かすことができる「データサイエンティスト」の需要が高まってきています。
データサイエンスの実用例
「データサイエンティスト」はデータを分析して、
様々なことを「分類分け」したり、「予測」したりすることができます。
その実用例を挙げると、
- 食品の需要予測
- 在庫の最適化
- ネット広告の最適化
- レシートの自動読み取り
・・・
などです。
YouTubeの関連動画や、ブログに記載される広告も、過去のデータを分析して、
そのユーザに合った動画や広告を載せるようにしています。
囲碁将棋ロボットから始まったAI(人工知能)が、
大量データやそのデータを扱う事ができるインフラが整ったことで、
日々高性能化してきており、世の中になくてはならないものになってきています。
データサイエンスの需要と年収
先程お話した通り、「エンジニア」と同様に「データサイエンティスト」の需要は高まってきています。
経済産業省も「データサイエンティスト」の育成に力を入れてきていますが、将来的にも人材が不足しています。
そのような経緯もあり、「データサイエンティスト」の年収は、
「平均650万以上」
と高水準です。
企業や個人のスキルによっては「1000万以上」となる場合もあります。
今後も需要や年収は下がることなく、さらに高まっていくと考えられます。
データサイエンティストの仕事内容
「データサイエンティスト」の仕事は、以下のような流れで進めていきます。
- 現状ヒアリング
- 課題定義
- データ収集
- データ分析・AIモデル作成
- 実運用で活用
現状ヒアリング
企業に対してを例にしておりますが、まずは現状分析です。
データサイエンスは、
「データサイエンティストにデータを渡して、AIに分析してもらう」
というような単純な仕事ではありません。
まずは「何が課題になっているのか?」を見つけなくてはなりません。
そのために企業の現状を知る必要があります。
「改善できるポイント」、「実際にどのように仕事を行っているのか?」
そのあたりを中心に現状をヒアリングしていきます。
課題定義
現状ヒアリングを基に、「課題定義」をしていきます。
課題に対して「どのデータ」を、「どう分析」して、「どう活かしていくか」を決めます。
システムエンジニアの「要件定義」と似たような感じです。
実際にデータを分析する前に「ゴール」を決めておきます。
データ収集・データ加工
データ分析するためのデータを収集して、分析しやすいように加工します。
データは企業内の基幹システムのデータから取得したり、世の中に出回っているデータを取得したりと様々です。
その取得したデータをデータを分析しやすい形に加工します。
具体的には、プログラミングでデータを読み込みやすいようにデータを綺麗にしたり、
不要な部分のデータを省いたり、補足したりします。
データ分析・AIモデル作成
データの用意ができたら、データをプログラミングで分析し、AIモデルを作成します。
データ分析やAIモデルを作成する方法は多岐に渡り、
「何をしたいのか?」によって、その方法は変わってきます。
データを読み込ませて、モデルを作成することを「機械学習」と言います。
※「ディープラーニング」は機械学習の中の1つの手法です。
作成されたモデルを使用することで、売上の予測ができるようになったり、
ユーザに合った商品をオススメすることができるようになります。
モデルを作成するためには、プログラミングスキルや統計知識が必要になります。
データサイエンティストにとっては、一番重要な部分です。
実運用で活用
最後に作成されたモデルを使用して、実運用に活かします。
作成したモデルに正確性があれば、企業の課題を解決できるでしょう。
また、新しい課題が見つかるかもしれません。
その場合は、また「現状ヒアリング」に戻って再スタートします。
データもまた蓄積されているはずです。
このように「データサイエンティスト」は、
- 現状ヒアリング
- 課題定義
- データ収集
- データ分析・AIモデル作成
- 実運用で活用
のサイクルを繰り返し行います。
データサイエンティストの必要スキル
「データサイエンティスト」に必要なスキルですが、
データサイエンティスト協会により、
- ビジネス力
- データサイエンス力
- データエンジニアリング力
と言われています。
ビジネス力は、
「課題背景を理解したうえで、ビジネス課題を整理し、解決する力」
データサイエンス力は、
「情報処理、人工知能、統計学などの情報科学系に知恵を理解し、使う力」
データエンジニアリング力は、
「データサイエンスを意味のある形に使えるようにし、実装、運用できるようにする力」
と説明されています。
少しわかりにくいので、私的解釈で分類すると、
- コンサルスキル
- プログラミング等のITスキル
- 統計等の数学スキル
と言えると思います。
コンサルスキル
先程お話したように「データサイエンティスト」の仕事はデータ分析だけではありません。
「課題を発見し、解決する」ためには、「コンサル力」が必要になってきます。
それに伴って、「データサイエンティスト」に限った話ではありませんが、
「ヒアリング力」「説明する力」、「資料にまとめる力」など、
基本的なビジネススキルももちろん必要です。
プログラミング等のITスキル
データ分析、AIモデルを作成するために「プログラミングスキル」が必要です。
プログラミング言語としては「Python」、「R」といった言語の習得が必要です。
実際の現場では「Python」の方を使用している場合が多いです。
プログラミングにより、データを加工したり、データを可視化して分析したり、
AIモデルを作成したりします。
また、実行環境を整えるために、インフラに関するITスキルも必要になります。
統計学等の数学スキル
データ分析をするためには、統計学を始めとした数学の知識も必要になります。
機械学習の勉強を進めていく上で、数式が何度も登場してきます。
数式が苦手でも「なんとなくの理解」はできると思いますが、
深い知識を身に付けるためには数式の理解が必須です。
プログラミングをする上では、
「確率」、「行列」、「統計」、「グラフの読み取り」といった知識は最低限必要になります。
「エンジニア」にはあまり文系理系関係ないとわたしは思っていますが、
「データサイエンティスト」となると数学の力がより必要になってくるので、
理系の方が有利に働くかもしれません。
データサイエンティストになるための勉強方法は?
エンジニアと同様に「本」、「スクール」、「WEBサイト」などで、
「データサイエンス」に関する勉強ができます。
「データサイエンティスト」の基本となるプログラミングスキルを身に付けましょう!
※特にこだわりがなければ言語は「Python」がオススメです。
わたし個人的にオススメなのが、
の2つです。
※どちらも有料です。
SIGNATE
「SIGNATE」は「データサイエンティスト」に関する勉強が、実際の課題に沿って学習できるサイトです。
「Progate」を知っている方であればイメージしやすいかもしれませんが、
「動画やスライドを読んで演習する」というタイプの学習サイトです。
簡単なものもあれば、難しい内容のものもありますが、
「データサイエンティスト」の仕事内容がつかみやすいと思います。
また「SIGNATE」は、「Kaggle」にようにデータサイエンティストの腕を競い合うコンペを開催しています。
勉強が一段落したら、コンペに挑戦してみるのも良いでしょう。
Udemy
「Udemy」はオンライン動画学習サイトです。
自分に合った「Python」に関する動画を見つけて、勉強をしてみましょう!
わたし的オススメは以下です。
まとめ:データサイエンティストとは?
ここまでの話をまとめます。
まとめ
「データサイエンティスト」の仕事の流れは、「SIer業界」の仕事の流れと良く似ています。
「システムエンジニア」の方は「データサイエンティスト」の仕事のイメージが付きやすいと思います。
わたし自身「SIer業界」の仕事をしてきましたが、
SIerの仕事の範囲だけでなく、データサイエンスの分野まで広げていこうと現在挑戦中です!
元々大学は数学科ですし、SQLのスキルはあるので、データ分析や加工も得意なので、
「なんとかなるのでは?」と思っています(笑)
挑戦の過程で学んだことや、苦労したことを引き続き発信していきたいと思ってます!
「システムエンジニア」としての実績はありますが、
「データサイエンティスト」に関しては全くの未経験です!
「フリーランスとして仕事を受けられるのか?」
正直これからどうなるか予想が付きませんが、頑張っていきます!
「エンジニア」と同様に需要が高まっていく職種です!
「データサイエンティスト」にこれから挑戦される方は
一緒に頑張っていきましょう!