データ資本主義
IT

データ資本主義 書評

効能

これからのデータ社会について理解が深まります

こんな人にオススメ

AI、人工知能、情報化社会の現状と行末を知りたい方

インターネットの利用で生み出されるデータ

皆さんはスマートフォンをお持ちですか?
私は時間、場所を問わず、暇さえあれば触っていますが、皆さんはどうでしょうか?
iPhone、そしてそのライバルとして世に送り出されたAndroid端末の登場以降、多くの方が情報操作端末を手にし、時間、場所を問わず情報操作活動を行うようになりました。
この情報操作活動から得られるデータは膨大なもので、まさにビックデータと呼ぶにふさわしい総量のデータが日々、世界中でやり取りされています。
そして、時を同じくして、機械学習の技術も再度脚光を浴びることになりました。
機械学習では有効な実証値を得るために、訓練データと呼ばれる機械が学習するためのデータが膨大に必要になるのですが、まさに前段で説明した「生の訓練データ」が日々、無尽蔵に生み出される時代となりました。
そして、ディープ・ラーニングと呼ばれる新たな機械学習手法の登場により、膨大なデータを用いて、効率よく規則性、法則性を見出すことが可能になったのです。
この膨大な訓練データ、そして、ディープ・ラーニングを利用し、GAFA(Google,Amazon,Facebook,Apple)とも呼ばれる巨大なインターネット・プラットフォーム企業は、消費者の消費活動を最大限にする施策に用いています。
つい数年前に「Googleは猫という概念を獲得した」というニュースがあったと思います。
なんのこっちゃ、という方向けに説明すると、Googleが開発したシステムに画像を送り込むと、それが猫の画像を含んでいるか否か、瞬時に見分けることができるのです。
そして、このシステムの機械学習に用いられたのが、日々、大勢の人びとが大量の画像、映像データをアップロードするYouTubeです。

AIの学習データはビックデータである必要はないが、ビックデータを用いるほうが制度の高い結果を得る場合が多い。したがって、AIの技術開発においては、ビックデータをどれだけ集められるかが重要だ。

データ資本主義

この画像認識技術はパターン認証と呼ばれる技術を利用しており、大量のデータから特徴点を探し出し、それが何を指し示すかをパターンとして識別しているのです。
iPhoneなどでも写真に写っている人物別にカテゴリ分けする機能もあるので、皆さんも目にした機会があるのではないでしょうか。
このように、我々が日々、スマートフォンに向かっている時間は、世界中で生の訓練データとして利用されているのです。
暇つぶしや趣味で使用しているスマートフォンの閲覧時間が知らない間に何かしらの機械学習に利用されているとは!怖いような凄いような、複雑な気持ちです。
GAFAさん、夜中の私のインターネット利用について、弁明があります。
あれを操作しているのは私ではありません。
私が飼っている猫です。
あなた方は「猫が夜中に何をするか、という概念を獲得した」に過ぎません。そこだけ、注意してください。

理論やモデルは死んだのか

本書では大量に発生するデータ操作がどのように我々の生活を変えてきたか、そして、我々の進歩にどれだけの貢献をしてきたか、その概要を実例を交えて説明しています。
ビックデータの活用は我々の経済活動、研究活動、技術の進歩に大きなパラダイムシフトを強いることになります。 もっともよくインパクトを受けたのは科学、物理、数学の分野ではないでしょうか。
我々の便利な生活を支える物理、数学の方式は、天才たちが生み出した様々なモデルを前提としています。
ここで言うモデルとは何でしょうか。本書では以下のように説明されています。

もっとも、使われるモデルの具体的な形は、分野によって違う。物理学ではニュートンの力学モデルのように、数式(多くの場合に、微分方程式)で記述されているモデルが普通だ。
経済学の場合は、数式のモデルもあるし、需要・供給曲線のように図だけで使えるモデルもある。人文・社会学では、マルクス主義、構造主義などのように「主義」と呼ばれることもある。この場合には、モデルは言語で記述されている。
このように、モデルの具体的な形は違うが、「現実を抽象化し、重要な要素相互関係を明らかにする」という点では、全て同じだ。その目的は、現実を理解し、予測することである。学問とは、モデルの探求であるとされた。

データ資本主義

そして、ビックデータの生成、機械学習の発展は、これまでの学問のアプローチを強烈に変化させてしまったのです。
著者はこれまでの理論、仮設駆動型というアプローチに対し、機械学習を利用した法則性の発見を「データ駆動型」と名付けています。
データ駆動型では、モデルを固定することなく、ビックデータを用いて、現象を説明できるモデルをコンピュータが自動推定します。
大量のビックデータを用いて、モデルの構築、検証、再構築を無尽蔵に行い、モデルを形作っていきます。
このため、モデルを作るのがむずかしい現象も扱うことができ、研究者が想像もしなかった新発見が可能となります。
一部の天才しかなし得なかった数式化や現象の言語化、物理法則の発見などを、機械学習を用いることによって、誰でも新たな法則性を見つけることができるのです。
オーマイガー

データ資本主義 感想・レビュー

最新の情報技術を紹介する本書は、IT業界に身を置く人だけでなく、ビジネスマン全般に参考になるものであると思います。
「Data is New Oil」 = データは新時代の石油である、とも言われていますが、大量に配布された情報操作端末から、ビックデータが生成され、高度に進化した機械学習によって様々な事象が解明されていく未来は、一体、どのような形になっているのでしょうか。
本書では紹介した事例以外にも様々な興味深い話が載っていますので、是非ともお手に取って、未来のあるべき姿に思いを馳せてみてください。 それでは、I’ll be back.