マネジメントとビジネストレンドの知見を得るMBAメディア

タグから検索する

MBAダイジェスト 2019/06/27

ビッグデータ分析(4)データ分析の第一歩、要約分析



執筆:村西重厚(BBT大学院MBA本科修了、データ・サイエンティスト株式会社 エグゼクティブ・ディレクター)
対象科目:ビッグデータ分析(豊田 裕貴 ビジネス・ブレークスルー大学大学院 客員教授、法政大学大学院イノベーション・マネジメント研究科 教授)

前半3回はビジネスデータ分析の概要をご説明してきました。後半からは具体的なビッグデータ分析手法をご紹介します。

データの読み取り方には法則がある

まずは基本的なデータの読み取り方からご紹介しましょう。
一般的にデータは下図のような表形式の中に格納されています。

この表にどのようにデータを格納するかについては、基本的な決まりがあります。

まず縦横の縦方向(行)にはデータの「対象」がはいります。そして、横方向(列)にはデータの「変数」が入ります。

もう少しわかりやすくするために、具体例を見てみましょう。

下図は営業担当者とその担当者が販売した商材の関係を表した表です。例えば、「営業担当1が商材1を114個販売した」と読み取ります。

上下の表には同じ数字が入力されていますが、データ分析の分野では異なる意味を持っています。

まず、上の表から見ていきましょう。
表は営業担当者が縦軸に、商材が横軸に並んでいます。

データ分析の世界では、このデータを文章にすると、
「ある営業担当者が、ある商材を〇〇個売った」
という意味となります。

それに対して下の表は、行と列を入れ替えています。縦軸は商材、横軸は営業担当者、となっていますね。
これを同様に文章にすると、
「ある商材を、ある担当者が〇〇個売った」
という表現となります。

それぞれ縦軸に文章の「主語」が入っています。

実際の活用のシーンを考えてみましょう。例えばメーカーが販売データを分析する際は、営業部門は営業担当者を主語として分析を行うので上の表を利用することになります。また製造部門は商材を主語とするので、下の表を用いて分析します。

またビッグデータ分析のソフトは、データは上記の意図を持って格納されていることを前提とした計算を行います。行と列の概念を間違えると、全く想定しない分析結果になってしまいます。繰り返しになりますが、データを扱う時は、表の縦方向は「対象」、横方向が「変数」として扱うよう意識して下さい。

要約はデータ分析の出発点

それでは実際に要約の事例を見ていきましょう。

下表のデータは、あるスーパーで数百人を対象に実施した顧客満足度アンケートの結果の一部で、お客様が満足度について、5点満点で答えたものを示しています。

一番左の「sample ID」という列は、お客様ひとりひとりのID番号です。 上でご説明した「データの対象」ですね。そして横方向の「生鮮食品の品揃えの満足度」などが「データの変数」となります。

このデータをみて、即座に何が言えるのかを見出すのは難しいでしょう。すなわちこのデータは既に「ビッグデータ」なのです。

さて、ビッグデータ分析の第一歩に、「要約」があります。
それぞれの評価項目を「要約」したものが下表となります。

この「要約」はそれぞれの「変数」の平均値を計算したものです。
(※実際には数百行あるデータの計算結果なので、上で示した10行のデータの平均値ではありません。)

アンケートを要約した結果、生鮮食品の品揃え、駐車場の広さの満足度の平均値は高く、商品陳列の仕方、レジの待ち時間の満足度が低い傾向がある、ということがわかりますね。このレベルの分析は、皆さんも日々エクセルなどを用いて実施されていると思います。

要約分析の注意点

さて、もしこのデータしか手元に無いとすれば、あなたはこのスーパーの経営者にどのようなアドバイスをするでしょうか?

このスーパーの「強み」は品揃えや駐車場の広さであり、「弱み」は商品陳列やレジ待ち時間となる。それでは弱みである商品陳列とレジの導線を改善しましょう、ということになるかもしれません。

しかしこのデータの要約だけで、
「お客様を増やすために満足度の低い項目から改善しましょう」
という意思決定をすると、ミスリードをしてしまう可能性があります。

何故ミスリードする可能性があるのでしょう。

変数の背後を考える

そもそもビジネスデータ分析の目的は、何らかの意思決定をするためです。今回は、お客様を増やすにはどの満足度を向上させるべきか?という目的でアンケートを実施しました。

ここでお客様を増やす、という目的をもう少し細かく考えてみましょう。

「増やす」を分解すると、対象を新規のお客様にするべきなのか、リピーターにするべきなのかなどが考えられます。また男女別や年齢別にターゲットの分析も必要です。この辺りはマーケティング戦略の判断要素となる部分です。

仮に新規のお客様を増やしたいという目的の場合、そのお客様達が重要視するのは、品質なのか、品揃えなのか、奥さんが買い物をする間、旦那さんが車内で待つために駐車場を充実させる必要があるのか、などを理解する必要があります。低い満足度の項目を改善しても、その項目の重要度が低ければ来店者数が増えるとは限らないのです。

そこで、このアンケートにはそれぞれの項目をどれくらい重要視するか、という質問項目を追加してあります。

次回は引き続きこのアンケートデータを用いて、要約手法だけでは見えてこない背後をあぶり出すための、「関係性分析」についてご説明します。

村西重厚

BBT大学院本科 修了生
データ・サイエンティスト株式会社 エグゼクティブ・ディレクター
一般社団法人起活会 代表理事
1972年 兵庫県神戸市出身
工学部機械科卒業後、メーカーで生産技術部門に従事。
その後、営業部門を経て新規事業部門でWEB事業を立ち上げる。
新規事業の立ち上げ時に経営知識の必要性を感じ、2013年にBBT大学院に入学。
2015年MBA取得。MBA取得後、ベンチャー企業に転職し、営業、マーケティング、資金調達などに携わる。
2017年より、検索ビッグデータ分析を元に企業戦略の立案・推進に携わる一方で、一般社団法人起活会を立ち上げ、起業家支援を行っている。
趣味は登山、クライミング、ギター。

※BBT大学院MBAプログラムの受講体験談はこちら