【IT/DX人材の採用ニーズ~ITサービス提供企業編】第3位:データサイエンティスト

ITサービス提供企業編

IT/DX人材の採用ニーズ~ITサービス提供企業編第3位は、データサイエンティストがランクインしました。

現在大流行中のAIを代表する職種だけあって、予想できた方も多いのではないでしょうか。自社プロダクト開発型企業だけでなく、支援型企業からのニーズも多く見られました。それどころか、ベスト3には入りませんでしたが、ユーザー企業からのニーズも少なくなかったです。

ところで、皆さまはデータサイエンティストとはどのような職種かご存じでしょうか。2012年にHarvard Business Reviewで「21世紀で最もセクシーな職業(The Sexiest Job of the 21st Century)」(https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century)と紹介されたことから近年よく耳にする職種ではあるものの、なんとなく知ってはいるが自信を持って説明できないという方も少なくないのではないでしょうか。

実際、弊社にいただく問い合わせにおいても、データサイエンティストに求める職務内容や期待される役割は企業によってまちまちです。特にデータやAIの利活用が急速に進む現代においては、先進的なベンチャー企業や一部の大手企業ではデータ活用に関連する職種が細分化されてきているものの、中小・中堅企業では、データを扱う人材を総じてデータサイエンティストとぶ場合もあります。

これでは、自社の認識と世間一般で定義されるデータサイエンティストの認識に齟齬が生まれ、せっかく採用したのにミスマッチなんてことになりかねません。

そこで、今回はデータ活用に関連する3つの職種、データエンジニア/機械学習エンジニア/データサイエンティストについて整理することで、自社が欲する「データサイエンティスト」がどれに当たるのか考えるための手がかりを提供します。そのうえで、なぜこれほどデータサイエンティストの需要があるのか分析し、最後に報酬レンジまでまとめてみます。

1. データサイエンティストとは

早速ですが、そもそもデータサイエンティストとは、どんな人材を指すのでしょうか?明確な定義はないのでしょうか?

一般社団法人日本データサイエンティスト協会のHPを見ると、次のように書かれています。

昨今、センサー・通信機器の発達、ネットサービスの普及などにより、収集・蓄積が可能なデータの種類と量が急激に増大しております。そして、これらの膨大なデータ(ビッグデータ)から、ビジネスに活用する知見を引き出す中核人材として「データサイエンティスト」に注目が集まっております。

この流れを受けて、企業では当該人材の獲得・育成に力を入れようとしておりますが、実際には新しい職業である「データサイエンティスト」には明確な定義がなく、対応領域も広いことから、さまざまな課題も生まれています。

https://www.datascientist.or.jp/aboutus/background/

次に独立行政法人情報処理推進機構(IPA)のHPを見ると次のように書かれています。

[データサイエンティストとは]DXの推進において、データを活用した業務変革や新規ビジネスの実現に向けて、データを収集・解析する仕組みの設計・実装・運用を担う人材と定義しています。

https://www.ipa.go.jp/jinzai/skill-standard/dss/datascientist/index.html

これ以上明確かつ詳細に定義することは難しいものの、両者を踏まえると少なくともビジネスに活用すべく、データを収集/解析する仕組みの設計/実装/運用を担う人材、とは言えそうですね。

ここでは、データサイエンティストの定義について厳密に論じることを目的としているわけではなく、各社に必要なデータサイエンティストを明らかにするための一助になることを目的としています。そのため、データを収集/解析する仕組みの設計/実装/運用する人材とはどのような人材なのかに焦点を当てたいと思います。

2. データを収集/解析する仕組みの設計/実装/運用

ビジネス目的であれ他の目的であれ、大量のデータを活用するためには少なくとも下記が必要になります。

精確に保存されたデータ
活用目的に適した形で整理/加工されたデータ
データを分析するための自動的な処理プロセス
処理結果を解釈し、示唆を導くための専門的知見

以下、簡単に説明します。

まず、データ分析の前提となるのがデータの精確性です。いかに大量のデータが集まっていたとしても、それが正しく保存されていなければ、分析の土台そのものが崩れてしまいます。「120」と入力した数値が、いつの間にか「210」に変わってしまうような状況では、そのデータはもはや信頼できるものとは言えません。

次に重要なのが、活用目的に最適化された形でデータが整理/加工されているかという点です。仮に「コンビニエンスストアの来店客が各人いくら使ったのか(顧客単価)」を知りたいにもかかわらず、現金払い、クレジットカード決済QR決済など支払い方法だけが記録されていても有意なデータとはなりません。つまり、データは将来的な活用を前提に、最初から適切な粒度や項目で設計/収集されている必要があるのです。それだけでなく、集めたデータの表記や単位なども統一されていなければならないでしょう。

さらに、こうしたデータが大量に蓄積されると、人力で全体を俯瞰し、規則性や傾向を見出すことは現実的ではなくなります。たとえば、過去に来店した1万人分の購買データから共通点やパターンを人の目だけで見つけ出すことは、ほぼ不可能でしょう。そのため、データの中に潜む法則性や類似性を自動的に抽出する処理プロセスが不可欠になります。

最後に、法則や傾向が見えたとしても、それだけで直ちにビジネスに活かせるとは限りません。たとえば「1週間で1,000人が合計40万円分の商品を購入した」という事実から、平均顧客単価が400円であることは分かります。しかし、「最も多い購入金額帯はどこか」、「高単価顧客と低単価顧客の行動にはどのような違いがあるのか」といった、意思決定に直結する示唆までは導けません。これらを明らかにするためには、数学や統計学に基づく専門的な分析知見が必要になります。

2015年頃までの日本では、現在ほどAIを活用する企業が多くなかったこと、そしてそれに伴ってデータサイエンスの知見を持つ人材が少なかったことから、①~④のほとんどを「データサイエンティスト」と呼ばれるデータ活用担当者が担うことも少なくありませんでした。しかし、近年はAI需要の高まりとともにデータの量も増え、これらを実現するための業務を3つの職種に分割することが一般的になりつつあります。

その3つとはデータエンジニア機械学習エンジニアデータサイエンティストです。

主な担当業務は、下記のようになります。括弧内にて上記のそれぞれ対応する番号を付しています。

データエンジニア機械学習エンジニアデータサイエンティスト
担当領域・精確なデータを収集するためのデータベース基盤やパイプラインの構築(①)
・データを活用するためのクレンジング(②)
・データを分析するためのロジックの実装(③)・データを活用目的に最適化するための要件出し(②)
・データを分析するためのロジックの設計/検証(③)
・処理されたデータの分析(④)
 

以下、それぞれについて簡単に見ていきましょう。

3. データエンジニア

データエンジニアは、誤解を恐れずに至極単純に言うならば、データを収集し保存するための基盤を構築する人材になります。

業務内容としては、必要とするデータの量や質に合わせたデータソースの構造設計/構築/運用、社内インフラや分析用ソフトウェアとの連携、収集した情報の機密性の担保などが挙げられます。そのため、インフラやネットワークに関する知見に加え、データの分類や活用方法に関する一定の知見が必要になります。

4. 機械学習エンジニア

次は、機械学習エンジニアについて見ていきましょう。

少し乱暴にはなりますが、機械学習(Machine Learning)とはデータからパターンを読み取り、それを元に予測を行う技術です。同じく話題になる深層学習(Deep Learning)も、機械学習の1種です。そして機械学習エンジニアとは、機械学習による予測を行うためのアルゴリズムを選定し実装するエンジニアのことを指します。

業務内容としてはデータ収集方針の立案、データを活用するために最適なアルゴリズムの選定、Pythonをはじめとする言語を用いたアルゴリズムの実装などが挙げられます。そのため、機械学習におけるアルゴリズムの理解やコーディング力などが必要になります。

5. データサイエンティスト

いよいよ、データサイエンティストです。

データサイエンティストとは何か。端的に言えば、ビジネスで活用される目的を踏まえて必要になるデータのタイプを規定し、収集されたデータを分析する人材のことです。

業務内容としては、ビジネス上の目的を達成するために必要となるデータを明らかにし、それらのデータを分析してビジネス有効活用できるように加工することが挙げられます。そのため、最低限のビジネス理解力と対話力、データやアルゴリズムに関する知見に加え、数学や統計学の知見も必要になります。

このように、細分化した業務内容から広くデータ活用に関わる人材を、3つに大別しましたが、皆様の求める「データサイエンティスト」はどのような呼称が適切でしょうか。もちろん、これらは非常にざっくりとした分類になりますので、より専門的な知見や技術を要する場合もあるかと思います。いずれにせよ、3職種のうちの1つなのか、あるいは複数の複合的な役割を指すのか、求める人材像を社内でクリアにしておく必要はあるでしょう。

※実際には、データサイエンティストがデータエンジニアの業務を担当するケースは稀で、兼務する場合はデータエンジニアの業務の一部を担当するケースがほとんどです。

しかしながら、なぜこれほどまでに各企業におけるデータサイエンティストのニーズは高いのでしょうか。次に、この点について簡単に分析します。

6. データサイエンティスト需要が高い理由

近年データサイエンティストを求める企業は自社プロダクト開発型企業及び支援型企業だけでなく、ユーザー企業においても高まっています。こうした背景には主に、(i)DXの加速(ii)AI技術の発展(iii)データサイエンティストの供給不足の3点が挙げられます。これらはそれぞれ独立の事柄ですが、互いに作用することで同職種のニーズを高めています。

(i)DX化の加速

2018年の経済産業省のDXレポート公表以降、日本においてデジタル技術を活用してビジネスを変革しようという動きが加速しました。この変革には社内の業務効率化を目的としたものもあれば、新たな事業を生み出すことを目的としたものもありました。その結果、様々な情報が電子化され、またこれらの情報を蓄積するための基盤が整備されたことにより、従来と比べて大量のデータが蓄積されることになりました。

こうしたなか、分析を行ってマーケティングに活かすデジタルマーケティングが浸透し、これまで以上にデータが価値を持つようになってきました。「ヒト・モノ・カネ」とされていた経営資本も「ヒト・モノ・カネ・情報」と捉えられるまでに、データの重要性が認識されるようになってきました。しかし、大量のデータを人力で分析していくことには限界があります。

(ii)AI技術の発展

一方で2000年代以降、データから規則性やパターンを学習し、新たなデータに対して予測や判断を行う技術「機械学習」が急速に発展していきます。「教師あり学習」「教師なし学習」「強化学習」といった学習の枠組みが整理され、機械学習を用いたAIが実用化されていきました。

(i)と(ii)が相まって、データ分析にAIを活用しようとする企業が増えてきました。しかしながら、AIを活用してデータ分析を行うには、データサイエンスと呼ばれる領域の専門知識が必要になります。

(iii)データサイエンティストの供給不足

データサイエンス領域の専門知識は一朝一夕に身につくものではなく、一定の教育を必要とします。すなわち、大学をはじめとした高等教育機関での教育が必要になります。一方で、2020年代初めにおいてこれらを学べる大学や学部は限られていました。また、比較的新しい学問領域ということもあり、これらを履修して仕事で用いている卒業生の数も多くありませんでした

※この他に、数学や統計学の知見を持つ理学部系人材が日本には少ないといった背景も考えられるでしょう。

すなわち(i)と(ii)によってデータサイエンティストの需要が高まっているにもかかわらず、(iii)の事情によって人材の供給数があまりに不足しているのです。そのため、転職市場にいるデータサイエンティストだけでは各企業のニーズを満たせなくなり、転職潜在層へのアプローチに取り組む企業が増え、弊社への問い合わせが増えたと考えられます。

最後に、データサイエンティストの年収レンジについて見ていきましょう。

7. データサイエンティストの報酬レンジ

報酬レンジ

上級データサイエンティスト:1,500万円-3,000万円(中央値:2,100万円)
※データエンジニア(一部)、機械学習エンジニア、データサイエンティスト全ての要素を満たす

中級データサイエンティスト:1,200万円-2,200万円(中央値:1400万円)
※機械学習エンジニアとデータサイエンティストの要素を満たす

データサイエンティスト:800万円-1,500万円(中央値:1,200万円)
※データサイエンティストとしての要素を満たす

※見やすいように中央値は100万円単位まで数値を丸めています。

いかがでしたでしょうか。

今回、企業によって定義の異なる「データサイエンティスト」というポジションを紐解いてみました。担当可能な業務領域に応じて、かなり報酬レンジが異なってくることが明らかになったかと思います。採用をご検討の際には本記事が要件を整理するための一助になれば幸いです。

また、これからデータサイエンティストを目指される方、あるいは既にデータサイエンティストと呼ばれるポジションに就いていて、さらなるキャリアアップを目指す方は、是非本記事をご参考にしてみてください。最後までお読みいただき、ありがとうございました!

Profile
代表取締役社長/President
向井 綾汰

2015年、SFJに入社し、製造、IT、インフラ、通信等、幅広い業界のリサーチ、コンサルティングに携わる。2019年よりITユニットのヘッドとして、役員・CxO・PM/PdM等、幅広いレイヤーのIT/DX人材獲得案件を主導。2021年にSFJ NEXT設立を主導しゼネラルマネージャーとして事業を牽引。2024年より代表取締役社長就任。
お問い合わせはこちら

ITサービス提供企業編