【6】データ分析

 21世紀に入ってから“ビッグデータ(big data)”という用語が現われ、2014年以降コンピューター関連の話題の中心となっている感があります。そして、この用語と併せて“データ分析(data analysis)”や“データアナリスト(data analyst)”という用語も頻繁に目にするようになってきました。
 実は、この“データ分析”という用語、概念DOAにもあるのですが「似て非なるもの」です。
 そこで、今回はこの二つの“データ分析”を整理してみました。

概念DOAのデータ分析~データ項目分析~

 概念DOAにおいて「データを分析する」ということは、「データの値が記録される“器”、すなわち“項 目”(に入る値)が、どのような性質を持っているのか」を明らかにすることです。このため、概念DOAでい う“データ分析”は厳密には“データ項目分析”というのが正しいといえます。

ビッグデータに対するデータ分析~データ値群分析~

 概念DOAのデータ分析に対して、昨今話題の「(ビッグ)データを分析する」ということは「データの値の集合体(群)が、どのような傾向を表しているか」を明らかにすることです。このため、ここでいう“データ 分析”は厳密には“データ値群分析”というのが正しいといえます。

データ値群分析におけるデータ項目分析の役割

 データ値群を分析する場合、そのデータ値が記録されるデータ項目の性質を知っておくことは重要です。そして、このデータ項目の性質を決める背景にあるのは、そのデータ項目の利用目的なのです。

 たとえば、会員制の販売会社では“購入者の年齢”は、その会員の生年月日から正確に網羅的に取得できますが、一方、コンビニなどでは“購入者の(購入時の)年齢”を正確に網羅的に取得するのは、コスト面・運用面も含めて非常に難しいと考えられます。そこで、コンビニなどでは「購入者の年齢層を、レジ担当者の主観により入力する」方法を採り、レジ機に「性別ごとに、“12歳以下”、“13~19歳”、“20歳代”、“30 ~40歳代”、“50歳代以上”のボタンを配置する」などしている様です。これは「正確性が確保できなくと も、網羅性を確保し大量のデータ値群を収集することによって、性別や年齢層別の動向を把握する」ことが利用目的にあると考えると、現実的と言えます。

 ちなみに、このような話題は拙書「どこでもDOA」の「第五章 概念の“タイミング”」でも触れています。