
Free Image on Pixabay
ビッグデータという言葉は、少し前であれば、ネット記事やブログなのでよく見かけました。ここ最近ではクライアントとのミーティングの場でもよく出てくるようになってきました。
特に部長職や役員クラスの方の口から出るようになると、浸透してきているなと感じます。
ビッグデータについてまとめられており、体系的に理解するのに役立ったのが、ビッグデータビジネスの時代 - 堅実にイノベーションを生み出すポスト・クラウドの戦略 という本でした。
ビッグデータ事例: Amazon のレコメンド機能
本書ではビッグデータの定義を、事業に役立つ知見を導出するための、「高解像」 「高頻度生成」 「多様」 なデータ、 としています。
具体的なビッグデータを使った例は、アマゾンのレコメンド機能です。
アマゾンは、ユーザーそれぞれの過去の購買情報や商品閲覧情報、自分と同じ商品を買った他のユーザーの情報などを活用し、私たちに 「おすすめ」 を提示してくれます。アマゾンが集めている膨大なデータの活用事例です。
ビッグデータ活用の3つの壁
本書で整理されていたことの1つが、ビッグデータ活用の時代の流れでした。著者の鈴木氏は、ビッグデータ活用に至るにはいくつかのステップを経る必要があると言います。そのために越えなければいけないのが3つの壁です。
第一の壁: データの電子化や自動化ができているか
IT 活用がされる前の時代は、顧客情報が紙ベースで保管されていたりなど、蓄積はするものの十分に活用しきれていませんでいた。
ネットやモバイルなどのインフラやデバイスが進化、普及し、データの生成や取得が格段にしやすくなりました。データが電子化され、収集や活用のために自動化されている状況です。これが第一の壁を越えた状態です。
第二の壁: ビッグデータを活用できているか
データを取得したものの、データを電子化したけども、結局はサーバーに保存されているだけ、というのが第二の壁を越えられていない状態です。ビッグデータが事業に活用されておらず、寄与していない状況です。
本書では、多くの事業者が第一の壁を越えているが、第二の壁を越えていないと書かれています。
第三の壁: データが広く流通されているか。
第三の壁は、データ流通がされているかです。
より広いデータの活用がされる状態です。例えば SaaS (ソフトウェアのサービス利用) は一般的になっていますが、同じような概念としての DaaS (Data as a Service) です。具体的には、データがサービスとして有償で提供される可能性です。
必要データや情報があり、自分たちで一から集めなくても、どこかから買ってきたらいいという認識です。データを集めている側も、今までは活用されず塩漬けのようになっていた膨大なデータ売ることができ、新たなビジネスになる可能性を秘めています。
第三の壁を越えた世界への期待
データを買いたい者と売りたい者がいるということは、取引の市場ができることが考えられます。
データ取引市場では、買い手と売り手をつなぎ取りまとめる中間業者が生まれます。データ自体があたかも貨幣のように流通するでしょう。
データをお金を通して売買するのではなく、データそのものが貨幣化し、価値として広く 「信用」 を得ている存在です。
以前に Google がデータ取引所の創設する記事がありました。
参考:Google Readies Ambitious Plan for Web-Data Exchange|Ad Age DIGITAL
過去エントリー:Google が計画する 「ウェブデータ取引所」 は、あなたと広告のミスマッチを解消してくれるのか
これまで利用されていなかった膨大なデータが広く社会に流通し、世の中をよくするように活用されることを期待したいです。
ビッグデータ活用の3つの阻害要因
ビッグデータのビジネスにはバラ色の世界が待っているとは言えず、課題もあります。
ビッグデータがあっても中身に価値がなければどれだけ膨大に集まってきても、何の価値もないゴミをせっせと集めているようなものです。活用の見込みが立ってもその通りにデータを扱える人がいなければ宝の持ち腐れです。
著者の鈴木氏が本書で指摘する阻害要因は3つです
- ビッグデータの取得と活用ができる統計学や情報技術のプロフェッショナルの人材不足
- プライバシー問題
- データの誤りと誤用に起因するもの
ビッグデータとプライバシー
今後の最大の阻害要因になると思うのは3つ目のプライバシー問題です。
消費者やユーザー関連のビッグデータを集める際には必ずと言っていいほど、この問題がついてまわります。意図的であろうがなかろうが、データには他人には知られたくないような情報も入ってきてしまいます。
人材不足や誤用はデータを取得し活用する側のこちら側の問題です。プライバシーはデータ収集される側の感情や生理的な反応も含まれます。個人情報保護法など、法律面でも制約もあります。
ユーザーデータを承認なしに収集していたキャリア ID
ビッグデータとプライバシーに関連して最近気になった話題は、Android や iPhone などのスマートフォンに組み込まれていたキャリア IQ のソフト問題でした。
参考:Android と iOS、プライバシーを丸裸にするソフトが仕込まれていたことが発覚|INTERNET Watch
キャリア ID のソフトは端末のほぼ全ての動作を記録し、携帯キャリアや端末メーカーに送信していました。
記録される情報は多岐にわたります。押されたキーとその種類、ブラウザで閲覧したURL、使用アプリ、電話やメールの送受信、GPS などの位置情報、カメラや音楽プレーヤーの動作状況などが含まれると言われています。
今回のキャリア IQ の問題点は、ソフトがユーザーの知らない (了承なし) 、見えないところで動いていたことです。また、ユーザーがソフトを無効にすることが非常に難しいことです。
ユーザーからすれば自分の知らないところで、モバイルの使用状況がまるわかりになっていたとすれば、不信感とともに強い不安を抱きます。
キャリア IQ の仕組みはビッグデータを集めるという視点で見ると、優れていると言えると思います。データを集める場合には、なるべく偏りがないほうがデータの質は高くなります。
ユーザーが知らない (意識していない) ということは、より自然な端末使用データが得られることになります。もし 「今から端末の使用状況を記録する」 と言われて使っていれば意識してしまい、普段の使用とは異なるデータになります。これが偏りとなり、結局そのデータを見ても本当の使用状況はわからないでしょう。
今回起こったキャリア IQ 騒動は、ビッグデータ収集技術・方法論としては正しいが、倫理的・個人情報やプライバシーでは問題が起こりました。日本ではあまり大きく報道されていないような気がしますが、この事例はビッグデータに対する大きな一石を投じたように思います。
最後に
本書の著者である鈴木氏は、ビッグデータの可能性を 「顧客のニーズを見極めることにつながる」 と言います。というのも、消費者本人に聞くよりも、集まって蓄積された消費者に関する膨大なデータをのほうが、本人自身よりも、その人のことを雄弁に語る可能性があるからです。
ジョブズのようなカリスマ経営者の判断・意思決定で数多くのイノベーションが実現されました。しかし、どの会社にもカリスマ経営者がいるわけではありません。イノベーションの武器となり得るのがビッグデータであると鈴木氏は指摘します。
上記のアマゾンの例では、ユーザーに 「あなたの好きな本のジャンル、好きな音楽は何ですが?」 と調査するのではなく、ユーザーがアマゾンを利用する過程で集まってくるデータを活用し、顧客のニーズにうまく対応しています。
これまでは記録できなかった色々な行動がデータとして蓄積され、ビッグデータとして活用される流れは今後も変わらないでしょう。課題はビッグデータの活用、特にマネタイズです。継続的に収益を生み出す源にできるかどうかです。
一方で、上記のプライバシー問題等をどう解決するか、データを集める側と提供する側でいかに win-win を築くかです。そんなことをあらためて考えさせられる本でした。
※ 参考情報
Google が計画する 「ウェブデータ取引所」 は、あなたと広告のミスマッチを解消してくれるのか|思考の整理日記
Google Readies Ambitious Plan for Web-Data Exchange|Ad Age DIGITAL
Android と iOS、プライバシーを丸裸にするソフトが仕込まれていたことが発覚|INTERNET Watch
キャリア IQ のプライバシー侵害騒動と 「ビッグ・データ」 の脅威|@シリコンバレーJournal ニューズウィーク日本版 オフィシャルサイト