スモールデータとは?機械の得意なビッグデータとは大きく異なる人間の領域

いくらが好きな人はタピオカも好き

これは大学の教員が実際に行った実験です。52人の女学生に114品目の食品に対して、好きか嫌いかを尋ねるだけのアンケートを行った結果、「いくらが好き(嫌い)な人はタピオカも好き(嫌い)」という事が分かりました。

これはビッグデータの分析にも使われているデータマイニングという情報分析の技術を使って解析した結果です。これと同じ結果をビッグデータ解析でも得られるはずですが、スモールデータでも一定の価値ある情報が得られるという好例でしょう。ちなみに、時間はかかりますが、やろうと思えば単純に「好き・嫌い」を手作業で分類していくだけでも似たような結果が得られます。

この結果が出た原因を「食感の類似」にあると仮定すると、食感が似た商品を同じコーナーに並べたり、同じ料理に使うことで売上に繋げられることは容易に想像がつくはずです。また、単純な小規模アンケートでも好みやニーズの調査が出来るということは、「無理にビッグデータを活用する必要はない」ということにも繋がります。

ただ、スモールデータの活用と銘打っているものの、「アンケートを分析する」なんてことは昔から良くやっていること。ある意味、スモールデータの活用が謳われるのは「安く済ませられるよ」と訴えているだけのようにも聞こえてきます。

そこで、極端な例として未来のスモールデータ活用例を考えてみました。

必要になるはずなので買っておきました

究極的なスモールデータの1つは、たった1人の人間から発せられる雑多な情報全てです。健康状態・経済状況・購入履歴・メール・チャット・SNSなど、個人が持つあらゆる情報がスモールデータとして利用可能になればどうでしょうか?

既に人工知能研究と合わせて分析が進んでいますが、「究極のパーソナルアシスタント」として、その人がこれから必要になるものや欲しいものをお勧め、もしくは勝手に買ってしまうようなサービスです。

勝手に買うのは困りますが、既に「病気や体調の解析」が購入履歴や検索結果から検出できるようになっています。例えば、「頭が痛い」「胃がゴロゴロする」「眠れない時」などの検索をした人がいれば、その人が持っている可能性が高い疾患を推測し、警告するようなシステムが研究中です。また、購入履歴から妊娠が発覚した女子高生などもいました。

もちろん、これはビッグデータを解析することによって発見した情報であり、厳密にはスモールデータの活用とは言い切れないかもしれません。

しかし、スモールデータの解析能力が高まれば、少数の例から価値ある情報を見つけることは難しくありません。先ほどの例のように、50例から好みを把握することだって出来るのです。もし、パーソナルアシスタントが個人の全ての情報を収集することができれば、そこから「次に買うもの」をみつけることだって出来るでしょう。

スモールデータを見なおしてみる

スモールデータではビッグデータのようになんの繋がりもない二つの商品「オムツとビールが一緒に買われる」ことを発見することは出来ません。また、大は小を兼ねると言います。実際の所、スモールデータで出来ることは、やり方次第でビッグデータでもできるでしょう。

しかし、コストと時間が圧倒的に違うのです。

自動運転車の人工知能開発に膨大な時間とコストが掛かっているのが良い例です。人工知能は人間と違ってビッグデータしか扱えません。結果、何十万キロと運転してもなかなか安全運転ができないのです。一方、人間は数十時間の運転で運転できるようになってしまいます。

これが実質的な「ビッグデータ」と「スモールデータ」の違いと言えるでしょう。ビッグデータの活用が叫ばれていますが、ビッグデータはコストも時間もかかります。スモールデータを効果的に活用できれば、ビッグデータを中心に情報収集をしている企業に勝てるかもしれません。

情報が大量に集まってくるからこそ、スピード重視の情報分析が出来ると良いですね。