3.技術トレンド | Internet Infrastructure Review（IIR）Vol.28 | IIJの技術

目次

3.2 ソーシャル・ビッグデータ

IoTによりもたらされる「事実を示すデータ」を、ここでは便宜的に「ファクト・ビッグデータ」と呼ぶことにします。それとは対照的な特性を持つデータ、例えば「暮らしを豊かにする…」とか「あなたのお好みの…」といった個人の感性や嗜好性を考慮する分析で使用するデータは「ソーシャル・ビッグデータ」と呼べるのではないかと思います。TwitterやFacebookといったのソーシャル・メディアで流通するメッセージなどがその典型的な事例と言えるでしょう。

一般に「雑多な情報の寄せ集め」と理解されがちなソーシャル・ビッグデータですが、Amazonのチーフ・サイエンティストであるAndreas Weigendによれば、ソーシャル・ビッグデータは急激に増大しており、2009年1年間に生成されたデータ総量は、有史以来2008年までに生成されたデータ総量を超えており、これが顧客の商品情報の探索や収集に革命的な変革をもたらしたと報告しています（※3）。

Weigendは、ソーシャル・メディアのユーザが、相互にメーカ・サイトや自身やその友人の感想、あるいは購入した商品の周辺について明確な情報をポストする事例が増えており、メーカが広報宣伝の一環として提供する情報より役立つ傾向にあること、また一部のメーカは、ユーザの率直なデータ提供を奨励し、有益なデータには褒賞する系統立った方法を用意していることを指摘しています。

これらの事実を背景に、今日のオンライン・マーケティングの世界が、ユーザ間の共同作業により第三者にとって有益で明確なデータを作成するモデルに移行（e-businessからmebusinessへの移行）しつつあることをWeigendは「ソーシャルデータ革命」と呼んでいます。ソーシャル・ビッグデータの分析は「顧客の期待が何を引き起こすのか?またそのような期待に直面する企業には何ができるのか?」との問いに対する答えを提示できるのかもしれません。インターネットで流通するビッグデータがますます増加していくことは自明ですが、今日のIoTの普及やソーシャルメディアの台頭が、流通するビッグデータの特性の二局化を促す状況を加速させているように考えています。

3.2.1 ソーシャル・ビッグデータの性質

ビッグデータ分析という観点で、ソーシャル・ビッグデータをファクト・ビッグデータとの対比で考えると、「機械的な生成が困難」「含意性が多元的」「意味的な曖昧さが許容される」「推測・憶測が許容される（誤りが許容される）」といった性質を持っていることが挙げられます。少々感覚的な表現を使えば、ファクト・ビッグデータが「機械が生成する硬いデータ」であるのに対し、ソーシャル・ビッグデータが「人間が生成する柔らかいデータ」と言えるのでないかと思います。

通常、データ生成に人間が介在すると、そこから得たデータの分析はその分難しくなります。例えば、大きな公園において一番過ごしやすいポイントを調査することを考えてみてください。「過ごしやすい」を「適正な気温」と仮定し、公園内に温度センサーのついたデバイスを1万個配置し、24時間データを収集し続けるシステムを構築して蓄積されたファクト・ビッグデータを分析する場合は非常に明快な結果が得られます。デバイスは公園内にくまなく設置できますし、設置さえすれば確実にその場所の気温データを得ることができます。1万個もあれば、そのうちの幾つかは故障するでしょうが、故障が確認できれば直ちに交換すれば良いのです。人間が「過ごしやすい」と感じる気温の地点をくまなく調べ上げることができるでしょう。

これに対して、調査員を1万人雇って「各ポイントの温度を調べてください」と依頼するのがソーシャル・ビッグデータでの調査・分析の方法です。生真面目な調査員であれば温度計を持参し「ポイントXXはYY度でした」と温度センサー付きデバイスに迫る正確な報告をしてくれるかもしれませんが、温度計など持たずに「池の周辺は寒いです」と非常に曖昧な報告をする調査員もいるでしょう。華氏の温度計を見て「72度です」と答えたり、ポイントまで出向かずに適当に嘘の報告をしたり、中には「森林地帯は過ごしやすいです」と見当違いな報告をしてくる調査員もいるかもしれません。これでは公園内の「適正な温度」のポイントを見つけるのは大変です。

ですが、調査員にお願いするのが「過ごしやすいポイントを探してください」という依頼だとしたら、調査結果はガラッと変わってくるでしょう。調査員は、まず過ごしやすいポイントに向かって移動するでしょう。その途上で知り合った他の調査員と意見交換したり、一緒にポイントを探し始めたり、意見が一致するポイントが見つかれば「ここが一番いいよね」といったやり取りをするのかもしれません。その結果、時間の経過と共に調査員が公園内の幾つかのポイントに集まるようになることが期待できます。そのタイミングを見計らって個々の調査員にヒアリングを行います。「今どこにいるのか?」「そこは過ごしやすいのか?」「そう思う理由は?」といった質問をすると、公園内の過ごしやすいポイントについて第三者が共感できる情報が得られるわけです。

では、どちらの調査結果が適切でしょうか?それは調査目的によって変わってくるでしょう。公園の管理や環境保全の担当者であればファクト・ビッグデータだけを必要とするのではないかと思います。しかし、公園内の売店のオーナーであれば、むしろソーシャル・ビッグデータによる調査結果を欲するかもしれません。この事例での両者の決定的な違いは、ファクト・ビッグデータは調査方法が一様で結果が均質な事実に基づく客観的なデータで構成されているのに対し、ソーシャル・ビッグデータは調査員（人間）の主観に基づくデータの集積物だということです。両者は共にビッグデータですからエラーデータに対処する「信頼性の考慮」が必要ですが、更にソーシャル・ビッグデータに関しては「データは正しいのか?誤りなのか?どの程度信用するか?」といった信用性も考慮した分析手法が必要になります。

（※3）The Social Data Revolution（s） Andreas Weigend MAY 20, 2009（https://hbr.org/2009/05/the-social-data-revolution.html）。

3.技術トレンド

IIJの技術

関連リンク

Internet Infrastructure Review（IIR）Vol.28 2015年8月31日

3.2 ソーシャル・ビッグデータ

3.2.1 ソーシャル・ビッグデータの性質

Internet Infrastructure Review（IIR）Vol.28
2015年8月31日