公開日: |更新日:
集計されたデータを分析するには、いくつかの方法があります。分析手法は個性があり、アンケート結果の分析に利用するなら、分析手法の特徴を理解しての活用がオススメです。このページでは、データ分析の方法で代表的なものの一つであるアソシエーション分析について解説します。
アソシエーション分析とは、データとデータの間にある関連を分析する手法です。例えば、「Aという商品を購入する50%の顧客は、Bという商品も同時に購入している」といった、ある商品の売れ方と別の商品の売れ方の間にある関連性や、「降水量が一定量を超えると、C商品の売り上げが一定増える」といった状況と商品の売れ方に存在する関連性を、アソシエーション分析で導きだせます。
アソシエーション分析は、「Aという条件が満たされる場合には、(一定の確率で)Bという結果が起こっている」という、複数のデータが示唆する一定のルールの解析を目指す手法と考えれば良いでしょう。
アソシエーション分析は、「マーケット・バスケット分析」と呼ばれることもあります。ECサイトでユーザーが買い物かご(バスケット)にいれる複数商品の関連を解析する際に使われることが多いためです。マーケット・バスケットという別称はありますが、小売り業の販売促進やマーケティング調査のためだけに使用されるデータ分析手法ではありません。
アソシエーション分析は多くの場面で使えるのが特徴です。アクセス解析の結果に対してアソシエーション分析を行えば、HP来訪時の検索キーワード間の相互の関係性を明らかにすることもできます。
アソシエーション分析は、複数のデータ間の相関関係を調べるというものではないのに注意です。例えば、「Aという商品を購入するユーザーの50%はBという商品も同時に購入している」というルールは、AとBを入れ替えたら成立するとは限りません。
わかりやすく言えば、「降水量が一定量を超えると、C商品の売り上げが一定増える」というルールが成立したからといって、「C商品の売り上げが一定増えると、降水量が一定量を超える」というルールが同時に成立しないものです。アソシエーション分析では、分析の対象となるデータの順序が重要といえます。
アソシエーション分析において、前提となるデータを「条件部」と呼ばれ、条件部から結論されるデータは「結論部」と呼ばれ、アソシエーション分析は複数のデータ間の因果関係を対象とし、成り立つ法則の解明を目的としています。
アソシエーション分析は「一項目対複数項目」「複数項目対複数項目の分析」を行うことも可能です。例えば、
といったルールも、アソシエーション分析を使って導きだせます。
アソシエーション分析は、複数のデータの間にある関係性や一定のルールを明らかにするものです。アソシエーション分析をアンケート分析で使うには、分析の対象となっている複数のデータの間に有意義な関係性があるかどうかという点に注意しなければなりません。
「営業時間の延長という要望を出している顧客の80%が『提供スピードの改善』という要望を同時に出している」というルールが導き出されたとしても、アンケートに応じた顧客の大多数が『提供スピードの改善』という要望を出している場合は、ルールは有意義なものとは言えません。
営業時間の延長の代わりに他の要望を入れても、同様のルールが成り立つ可能性が高いためです。アソシエーション分析を使用しながら、複数のデータの間で有意義な関連・ルールを見つけていくためには、どうすればよいのでしょうか。
アソシエーション分析では、「支持度」「確信度」「リフト値」の三つの値を参考にしながら、有意義なルール・関連を複数のデータの間に探していきます。具体的に見ていきましょう。
支持度とは、アンケートに応えた顧客の全体数に対する「Aという要望とBという要望を同時に出している顧客の数」の割合です。公式にすると、
支持度=条件部(A)と結論部(B)をともに含むデータ数/データ全体数となります。支持度があまりにも低い場合、「Aという要望とBという要望を同時に出している顧客」の絶対数がそもそも多くはない、ことを意味するため、AとBの間に見いだされるルールが有意義なものである可能性は少なくなります。
確信度は「信頼度」とも呼ばれます。確信度とは、「Aという要望を出している顧客」全体の内での、「Bという要望も同時にだしている顧客」の割合です。公式にすると、
確信度=条件部(A)と結論部(B)をともに含むデータ数/条件部(A)を含むデータ数となります。確信度が高ければ高いほど、AとBの間に見出されたルールは有意義なものである可能性が高くなります。ですが、確信度の解釈には注意が必要な面もあります。結論部(B)の全体に占める割合が高い場合、条件部にA以外のデータを代入しても、同様のルールが成立する可能性が非常に高くなるためです。
リフト値とは、「確信度と、全データ数のうちで条件部を含むデータが占める割合の倍数」を指します。つまり、「『Aという要望を出している顧客』全体の内での、『Bという要望も同時にだしている顧客』の割合」と、「アンケート結果の全体の内における、Bという要望を出している顧客の割合」の倍数がリフト値となります。公式にすると、
リフト値=確信度/(結論部(B)を含むデータ数/データ全体数)となります。リフト値が低ければ低いほど、AとBの間に見出されたルールが有意義なものである可能性は低くなります。例えば、アンケートに応えた顧客の総数が100人である場合に、Aという要望とBという要望を同時に出している顧客の数が10人であるのに対し、Aという要望を出している顧客の総数が20人、Bという要望を出している顧客の総数が40人であるとき、リフト値は
(10/20)/(40/100)=1.25Mとなります。リフト値は1を超えると、見いだされたルールが有意義なものである可能性が高くなります。逆にリフト値が1を下回る場合、ルールが有意義なものである可能性は低くなり、Bという要望はAという要望とは関係なく、単独の理由で出されている可能性が高くなります。
複数のデータの間のある関連性を、支持度、確信度、リフト値の三つの基準から評価することで、より有意義な関連性導き出すことを可能にするアソシエーション分析。用途は小売業のマーケティングといった分野だけには限られません。アンケート結果に応用すれば、顧客のニーズの分析や要望を受けての改善案の具体化など、多くの場面でデータの管理・分析に役立てられます。
費用で比較!
Copyright (C) マークシート導入で業務効率化のススメ All Rights Reserved.