データサイエンティストが不足している!

はじめに

データサイエンティストという言葉が出てきて久しく、このブログを見ていただいている読者の方には耳慣れたワードになっていると思います。

そして近年大きく需要を伸ばしており、今では求める企業の6割が目標人数を確保できなかった、という調査結果も出ています(※)。

※ データサイエンティストの 採用に関するアンケート調査結果

みなさまの所属する企業にデータサイエンティストの方はいらっしゃいますでしょうか。ここではデータサイエンティストとは何なのかを明らかにし、不足する中でもデータサイエンスを実施するために、企業でできることを考えていきたいと思います。

データサイエンティストの活躍分野

まずデータサイエンティストの方がどのような分野で仕事をしているかを見てみます。

たとえば社内業務ではデータ管理業務、商品やサービスの企画開発などが挙げられます。全ての業務データを管理して一般ユーザに使いやすくする、膨大な売上データやユーザの声を多角的に分析して新しいモノを作り出す補助をする、といったことです。業務やデータの意味についてよく知っている必要があります。

社外サービスではどうでしょうか。シンクタンクやコンサルタントではお客様の持つ種々様々なデータを分析し、今後の経営の方向性や戦略を提案するという業務があります。こちらではお客様の業務や業界について深く広い見識を持っていることが重要です。

またデータサイエンティストが必ずといっていいほど貢献している分野が、機械学習や深層学習です。大量データをAIに読み込ませ、人間の認知する正解、またはそれに近い結果を機械が自ら導き出すための仕組みを作成することが目的です。用途によって社内外サービスとして展開することができそうです。

データサイエンティストとビッグデータ

ではどのようにしてデータサイエンティストという職務が生まれたのでしょう。それには2010年初頭から話題に上り始めたビッグデータが関係しています。

ビッグデータとはその名の通りのものです。少し具体的に言うと、社内外から集められたデータにプラスして従来は記録もされず捨てていたデータも取り込み、それまでのデータ管理システムの能力では扱いきれないほどの大きなデータのことを指します。

そしてこの巨大なデータを活用して関連性を見出し、役立つ指標を探し当てることが必要になりました。この作業には多くの情報科学の知識が必要であったため、データサイエンティストと呼ばれるようになったようです。

プログラミング言語の進化

データサイエンティストという言葉が出てきてまだ10年も経っていないのに、データサイエンティストが多くの場で活躍しているのはプログラミング言語の進化が大きいと思われます。

たとえば以前から使われていたPythonはAIやRPA開発が行われるようになってからさらに有名になりました。またRは統計分析の仕組みを構築することにかけて独自の立場を確立しています。その他にも新しい言語が次々と出てきているようです。これらの言語に特徴的なのは大規模なコミュニティです。実際の利用者が互いに理解を深め、機能を増強させ続けることで使いやすく発展する仕組みができています。

データサイエンスを行うには

これまでに述べてきたようにデータサイエンティストに求められるのは、自社やお客様業務とその業界の素養や、ビッグデータの分析や統計を駆使できる能力、そしてプログラミングの経験と多岐に渡ります。

これらを満たす担当者を自社内で見つけることは容易ではありません。それでもデータサイエンスを行う必要がある場合、その手段としてまず横のつながりの強化が考えられます。社内でデータサイエンティストを立ててすべてを任せるのではなく、それぞれの能力を持つ業務担当者間でコミュニケーションを図り、役割を補い合うことでデータサイエンティストと同等か、人数が多い分それ以上の成果を上げる可能性があります。

おわりに

今回はデータサイエンティストについて考えてみました。現在、「IoT」「DX」といったキーワードがクローズアップされ、ますますデータの活用や分析が重要視されています。今後、データサイエンティストという職務はますます重宝されていくことでしょう。

ちなみに弊社ではBIツールを扱っており、多くの企業様において分析業務で利用されています。データサイエンティストのデータ分析業務でももしかしたらお役に立てる場面があるかもしれません。 ご興味がある方は↓からツールの詳細をご確認ください。

製品ロゴ