サイトアイコン Stone Washer's Journal

スモールデータとは?機械の得意なビッグデータとは大きく異なる人間の領域

ビッグデータというワードがあちこちに聞かれるようなりましたが、そこで当然「ビッグがあるならスモールもあるの?」と思うようになります。スモールデータというワードは存在しますが、意外と知られていません。しかし、これは意外と人間にとって大切になってくる領域です。

ビッグデータで扱われるような膨大な情報の取り扱いには機械や人工知能の助けが必須です。一方、スモールデータを効果的に活用する能力は機械にはありません。あったとしてもビッグデータをベースにした情報活用に過ぎず、人間のスモールデータの活用能力には遠く及ばないのです。そこで、そんなスモールデータデータについて簡単に解説していきます。

小さな情報を深掘りしていく

ビッグデータの活用では、それこそ何千何万何億もの情報から価値ある情報を見つけます。ビッグデータの使い方は多岐にわたっており簡単に説明できるものではありませんが、一言で言うなら「膨大なデータから統計学的手法を使って新しい発見をする」ということです。膨大なデータの抽出・集計・整理にはコンピューターや人工知能の能力が欠かせません。人工知能の発達とともに、このビッグデータの活用能力は飛躍的に進歩すると考えられています。

一方、スモールデータの情報量自体は僅かです。しかし、その情報を深く考察していくことによって価値ある情報を見つけます。これは言わば、「探偵のような洞察力で小さなデータから新しい発見をする」ようなものでしょう。探偵はなんてことのない情報から真実を見つけ出します。同様に、科学捜査で微量の血液や唾液から犯人を割り出すのもある意味スモールデータを活用していると言えるでしょう。

スモールデータの概念自体は新しいですが、これは普段から人が自然に行っていることです。眠そうにしている人を見たら、「遅くまで残業してたのかな?」とか、「飲み会があったのかな?」とか、「悩みがあって眠れなかったのかな?」などと推測するはずです。相手が大きなプロジェクトを抱えた同僚なら残業が正解でしょうし、試験明けの大学生なら飲み会の可能性が高いです。これをわざわざ「スモールデータ」などと呼称するのは大業ですが、広い意味でこれはスモールデータの活用といえます。

ただ、現実問題として「1つや2つの情報」を活用してビジネスに繋げるには無理があります。実際に「スモールデータ」というデータの活用を考える場合、スモールデータは「店舗」や「中小企業」という単位で収集した比較的少量の量のデータことだと考えると良いでしょう。それに対して、ビッグデータは店舗や会社に囚われない「大企業」か「業界規模」ので収集した圧倒的な量のデータのことを指します。

単純に情報量がビッグデータに対して少ないという意味で、スモールデータという言葉が使われるケースも多いですね。これが注目されるようになったのは、スモールデータからは「ビッグデータでは得られない情報が得られる点」や「コストがかからない点」が関係しています。スモールデータでは、必要な情報量が極めて少ないため、どんな状況でも、誰でも活用できます。それこそ、ツイッターのツイートを見るだけでも情報が得られるでしょう。

不具合や新しいニーズの発見などは「ユーザーからの要望」など少ないデータから抽出していきますが、これも広い意味でのスモールデータの活用ですね。

スモールデータ活用の具体例

言うのは簡単ですが、やるのは難しそうです。そこで、ビジネスなどに活用できそうな具体例を紹介しましょう。

40代の男性が子供向けのゲームを買う

こんな情報があったとしましょう。これだけでは情報量が少なすぎるため、ビッグデータ的にはこのデータは無価値です。強いて言えば、40代の男性が子供向けのゲームを買うことがあるという事実ぐらいしかわかりません。

しかし、スモールデータの活用ではこの情報を深掘りします。購入した日時と場所、男性の容姿や購入した玩具の情報まで調べましょう。男性はサラリーマン風。会社帰りの時間帯。クリスマス前。購入したのは妖怪ウォッチの最新版。ラッピングを依頼。

ここまで聞いて、「自分の子供へのクリスマスプレゼントのために買った」と推測しない人はいません。奇跡的にそういう人が来店したと考えることもできますが、妖怪ウォッチの人気から考えて、同じニーズを持っているのがこの40代男性だけではないと考えるのが自然です。父親や母親をターゲットにした妖怪ウォッチのクリスマス向けキャンペーン等が売上増に繋がることは容易に予測出来るでしょう。

たった一人の客を見ていきなりやろうとはならないでしょうが、その店舗においてある程度の数(数人から十数人)が出ているのなら、動き出しても良いはずです。情報の数が無かったとしても、情報の密度を増やすだけで得られる情報は大きく変わってきます。

これは既に行われている「伝統的な」スモールデータの活用例です。これだけだと、「そのくらいならウチもやってる」と言われてしまいます。次は、もっと情報分析に絡ませた活用例をご紹介します。

いくらが好きな人はタピオカも好き

これは大学の教員が実際に行った実験です。52人の女学生に114品目の食品に対して、好きか嫌いかを尋ねるだけのアンケートを行った結果、「いくらが好き(嫌い)な人はタピオカも好き(嫌い)」という事が分かりました。

これはビッグデータの分析にも使われているデータマイニングという情報分析の技術を使って解析した結果です。これと同じ結果をビッグデータ解析でも得られるはずですが、スモールデータでも一定の価値ある情報が得られるという好例でしょう。ちなみに、時間はかかりますが、やろうと思えば単純に「好き・嫌い」を手作業で分類していくだけでも似たような結果が得られます。

この結果が出た原因を「食感の類似」にあると仮定すると、食感が似た商品を同じコーナーに並べたり、同じ料理に使うことで売上に繋げられることは容易に想像がつくはずです。また、単純な小規模アンケートでも好みやニーズの調査が出来るということは、「無理にビッグデータを活用する必要はない」ということにも繋がります。

ただ、スモールデータの活用と銘打っているものの、「アンケートを分析する」なんてことは昔から良くやっていること。ある意味、スモールデータの活用が謳われるのは「安く済ませられるよ」と訴えているだけのようにも聞こえてきます。

そこで、極端な例として未来のスモールデータ活用例を考えてみました。

必要になるはずなので買っておきました

究極的なスモールデータの1つは、たった1人の人間から発せられる雑多な情報全てです。健康状態・経済状況・購入履歴・メール・チャット・SNSなど、個人が持つあらゆる情報がスモールデータとして利用可能になればどうでしょうか?

既に人工知能研究と合わせて分析が進んでいますが、「究極のパーソナルアシスタント」として、その人がこれから必要になるものや欲しいものをお勧め、もしくは勝手に買ってしまうようなサービスです。

勝手に買うのは困りますが、既に「病気や体調の解析」が購入履歴や検索結果から検出できるようになっています。例えば、「頭が痛い」「胃がゴロゴロする」「眠れない時」などの検索をした人がいれば、その人が持っている可能性が高い疾患を推測し、警告するようなシステムが研究中です。また、購入履歴から妊娠が発覚した女子高生などもいました。

もちろん、これはビッグデータを解析することによって発見した情報であり、厳密にはスモールデータの活用とは言い切れないかもしれません。

しかし、スモールデータの解析能力が高まれば、少数の例から価値ある情報を見つけることは難しくありません。先ほどの例のように、50例から好みを把握することだって出来るのです。もし、パーソナルアシスタントが個人の全ての情報を収集することができれば、そこから「次に買うもの」をみつけることだって出来るでしょう。

スモールデータを見なおしてみる

スモールデータではビッグデータのようになんの繋がりもない二つの商品「オムツとビールが一緒に買われる」ことを発見することは出来ません。また、大は小を兼ねると言います。実際の所、スモールデータで出来ることは、やり方次第でビッグデータでもできるでしょう。

しかし、コストと時間が圧倒的に違うのです。

自動運転車の人工知能開発に膨大な時間とコストが掛かっているのが良い例です。人工知能は人間と違ってビッグデータしか扱えません。結果、何十万キロと運転してもなかなか安全運転ができないのです。一方、人間は数十時間の運転で運転できるようになってしまいます。

これが実質的な「ビッグデータ」と「スモールデータ」の違いと言えるでしょう。ビッグデータの活用が叫ばれていますが、ビッグデータはコストも時間もかかります。スモールデータを効果的に活用できれば、ビッグデータを中心に情報収集をしている企業に勝てるかもしれません。

情報が大量に集まってくるからこそ、スピード重視の情報分析が出来ると良いですね。

モバイルバージョンを終了