どうしていま データサイエンティスト が熱いのか?

「21世紀で最もセクシーな職業」として表現される「データサイエンティスト」は、データ分析のプロフェッショナルで、ビジネス課題に対してプログラミングや統計学の知識を駆使して分析を行い、解決策を提案する職業です。

この記事では、どうしていま データサイエンティスト が注目されているのかを、

  • AI / 人工知能 とデータサイエンティストの関連
  • ビッグデータ とデータサイエンティストの関連
  • データ分析することのメリット

という観点から紹介していきます。

AI / 人工知能の根幹は「学習データ」にあり!

最近人工知能や AI が発達して将来的に仕事を奪う AI によって代替されるというようなことが言われておりますが、その AI や人工知能ってどういう技術で動いているのでしょうか?

私たちがイメージする AI は、写真を見るだけでものを判別し、コースや周囲の状況を自分で判断して自動運転するというようなことができますよね。
(厳密には、AIが自分で判断するのでなくて、あらかじめ設計されたどのインプットかを判断し、それに対応したアウトプットを行います。)

ただしそのように AIが物を判断したり未来を予測したりするようになるためには、あらゆるパターンを想定した膨大なデータを事前に学習させる必要があります。

その事前学習に必要とされるデータはただ数があればいいというものではなく、運用したいAI に適したデータでなければなりません。

例えば、写真から動物の種類を判断させたいのに、種類にばらつきがある、昆虫などの別の生物の写真が学習データに混入していたら、正確な判別ができませんよね。

このように、AIをつくるには学習に必要なデータを準備し、不要なデータを除去・加工して、AIが学習できるようにデータを整える(データの前処理)という作業がどうしても必要となっていきます。

そのための技術や経験を持つのが「 データサイエンティスト 」だと私は考えております。

またデータサイエンティストの重要な役割は、プログラミングや統計学の知識を有してコードを書く、という側面ではなく、ビジネス課題を設定しそれへの対応策を検討できるという点にあります。

人工知能や AI を作ること自体が目的なのではなく、それを用いてある課題を解決したいから人工知能や AI が作られるべきなのです。そういったビジネス課題に対してどのような人工知能や AI であれば解決できるか、そしてその人工知能や AI を作るために必要なデータとして何が必要なのか、それをどう集めたあとに前処理するのか。

そしてそこまでに留まらず AI を作成した後も動作確認や更新と最初から最後までに直接的ないしは間接的に関わることができます。

ビッグデータの時代

「大量のデータをマネージできる人が勝つ」「データが資本となる」

こういった傾向は今後ますます強くなってくると思います。それは既に今の世の中が大量のデータを所有している、つまりデータ資本力のある企業がどんどん勝ち続けていく仕組みになっているからです。

インターネットビジネスで有名な企業群 「Google / Amazon / Facebook / アリババ」、通称「GAFA」と呼ばれますが、これらの企業のサービスを日常的に使っている人が多いと思います。

これらのGAFAと言われる企業は、我々の生活に商品やサービスを提供し利益を得るとともに、我々の大量の行動データ(例えば検索履歴や購買履歴)をもとにさらなるビジネス展開を行っております。

例えば Amazon を見てみますと、Amazon で物を購入した後に「あなたへのおすすめ」であったり「他の人はこれを合わせて購入しています」というように類似やセット商品を紹介される場合がありますよね。

あれは Amazon が過去その商品を購入した人の傾向やデータから、次にその商品の購入者が購入する可能性の高い商品をおすすめして追加の購入を狙うものです。

大量のデータはGAFAだけでなく、私たちが日常的に使っているスマートフォンやウェアラブルデバイスでも大量のデータが蓄積されております。

例えば GPS 機能を使ってどのような行動範囲で移動したか、歩数計などの機能からはその日の移動距離や消費カロリーまで分かってしまいます。

このような行動範囲や活動についてのデータまで取得されるのはひとえにセンサー類が小型・安価になり様々な製品に取り付けることが可能になったからです。

逆に言うと、大企業でなくても自分のデータを簡単に取得できる時代になったということです。

私はマラソンが趣味ですが、このようなスポーツウォッチを利用するとその日に走った距離や歩数だけでなく、活動強度や階段を登った段数、睡眠の質まであらゆるデータがライフログとして記録されますのでそれを健康管理の目安に活用しています。

これらのデータを有効活用して自分自身の体調を把握することができれば、いま自分の調子がいいのか悪いのか、適度な睡眠を取れているのか、今度の休日は出かけずに家でゆっくりと過ごしたほうがいいのか、、そういったことを把握することができます。

他にも資産運用のために株や投資をやっている人であれば金融商品の金額推移グラフを見たことがあると思います。これもいわば一種のビックデータであり、過去のデータを読み解くことでこの金額の推移から未来を予測することができればそれに適した行動かっこ金融商品を購入しか売却か今年することで利益を得ることができるかもしれません。データサイエンティストになってビジネス現場でバリバリ活用する!とまでいかなくても、このように「大量のデータを分析するコツ」は、自分の日々の暮らしを豊かにすることのできる知識だと思っています。

温故知新 未来を知るには過去 / 現在の流れを理解することから

データサイエンスを使用すれば、個人の利益の話だけでなくて、自分の将来10年、20年後の未来を予測することにも使えます。

以下の二つの本を知っていますでしょうか?

ファクトフルネス

「ファクトフルネス」は自分たちの常識だと思っていたものを実際のデータを使ってそれがいかに思い込みや偏見であったかといったものを説いた本であり、世界的なベストセラーとなりました。

未来の年表

「未来の年表」は私たちの住む日本の未来を人口減少や労働環境の変化でどのような未来になるのか、そしてその来たる未来を私たちはどのような制度・仕組みを持って迎えればいいのかといったことが書かれております。

これらはいずれも統計データをもとに現状を分析、未来を予測した本となっております。

データを読み解くことができれば「自分が感覚的に信じていたものを根拠をもって示す」ことができ、これは「他人でなく自分の頭で判断するための技術」を得るということにつながるのです。

データは無料で大量に存在している

データを扱うことができると生活していくうえで様々なメリットがあると紹介してきました。

しかし、こういう話をすると「大量のデータがあってことこそ成り立つものであって自分にはそんな大量のデータを集める手段や方法がない」と思う人がいるかもしれませんが、実は今の世の中はデータの探し方や場所さえわかれば誰でもがデータを得られるのです。

例えば、未来の年表で使われているデータの一覧をご覧ください。
これらすべてのデータは国がホームページ上で公開しているものでおり、誰でもアクセスできるものです。

経済産業省 「IT人材の最新動向と将来推計に関する調査結果」
国立社会保障・人口問題研究所 「日本の将来推計人口」「出生動向基本調査」
総務省 「就業構造基本調査」
内閣府 「高齢社会白書」「目指すべき日本の未来の姿について」
厚生労働省 「社会保障に係る費用の将来推計」
国土交通省 「国土のグランドデザイン2050」

書籍:未来の年表 より

無料で公開されている情報を使ってここまでの未来予測を行うには、ある程度その業界の知識や経験が必要です。

ただし、我々の周りにある大量のデータを分析して有用な知識を探し出して、それを新たなビジネスチャンスに生かすことができれば、私たちの生活を少し豊かにするかもしれませんし、大きく人生を変えることになるかもしれません。

しかし、データサイエンティストってあまり聞かない単語だし、それが今どれくらい求められているのか、それが今後どうなるか想像しにくいですよね。

早速私も、その経済産業省が公開するデータを使って未来予測をしてみたいと思います。

経済産業省の将来推計および人材確保のための政策

以下のグラフを見てみてください。経済産業省の調査結果ですが、2030年にはIT人材が59万人不足するというように公表されております。

IT人材の中でも特に AI や人工知能、そしてビッグデータが発達し続けるのであればこのデータサイエンティストの需要は高まり続けると言えるでしょう。

IT人材の最新動向と将来推計に関する調査結果 より

そしてこれらの高い専門性を学ぶためのスクールを「第四次産業革命スキル習得講座」の認定講座とし、この認定講座は「専門実践教育訓練給付金制度」との連携が行われており事前申請を行い、基準を満たした場合に給付金が支払われます。

IT・データを中心とした将来の成長が強く見込まれ、雇用創出に貢献する分野において、社会人が高度な専門性を身に付けてキャリアアップを図る、専門的・実践的な教育訓練講座を経済産業大臣が認定する制度です。

経済産業省 第四次産業革命スキル習得講座認定制度

さらに知りたい人は以下の記事もどうぞ。

政府の公表するデータや政策から、将来的にデータサイエンスの技術・経験を有する人の市場価値が上がるのではないか、ということが予測されます。

とはいっても世の中人工知能 AI といった言葉が先行していてこのデータサイエンティストという言葉の浸透が遅れているというのが私の受ける印象です。

データサイエンティストについてもっと知りたい!

ここまで、データサイエンティストの可能性と将来性を紹介してきて興味が湧いてきのではないでしょうか。

人材として需要が高まっているデータ分析のプロフェッショナルである「データサイエンティスト」について学ぶことは、これからのキャリアを考えるうえで大きな力になりますので、さらに調べたい人は「 データミックス 」のHPをご覧ください。

そして少しでも興味を持てば、このデータミックスの無料説明会に参加すると

  • データサイエンティストとは何か
  • どのようなデータサイエンティストが望まれているのか
  • 将来なぜ求められるようになるのか

という本当にデータサイエンスの基本的なところから紹介してくれます。

コースに参加するつもりのない人でも、今の時代は人工知能や AI 、データサイエンスに関する有料のセミナーが多い中で、手っ取り早く・無料で業界の全体像を聞けるチャンスなので是非活用してみてはいかがでしょうか。

さらに プログラミング / 人工知能(AI) / 機械学習 について興味がある人は下のまとめページも読んでみてください!

スポンサーリンク

シェアする

  • このエントリーをはてなブックマークに追加

フォローする

%d人のブロガーが「いいね」をつけました。