公開日:
|更新日:
マークシートを使ったアンケート分析に決定木分析を活用
アンケート分析手法「決定木分析」とは?
集計されたデータを分析したいと考えた時、さまざまな分析手法の活用が大事です。分析手法は特有の個性があり、アンケート結果の分析に応用する場合は、向き不向きについて理解しておくと良いでしょう。このページでは、そうしたデータ分析の方法の内で、代表的な手法の一つといえる決定木分析について解説します。
決定木分析とは、特定の結果をもたらす要因のうちで最も関連性が深い要因(あるいは要因の組み合わせ)を解析するために使われる分析方法です。決定木分析は分析目的と、結果の要因になっていると推測されるさまざまな変数や属性が同時に含まれたデータを分析対象となります。
決定木分析を使えば、自社製品を何度も購入しているユーザーの属性やユーザーが自社製品を購入する可能性を潜在的に持っているか、といったデータを明確にできます。クラスター分析は「教師なしの分析」とよばれていましたが、決定木分析は「教師ありの分析」とされます。
「教師なしの分析」は、分析前に分析の意図を定める必要がありません。例えば、クラスター分析はデータがどのように分析されるか、という点を分析するからです。決定木分析は、事前に考えられた目的のために分析を行うかが明確でなければなりません。
理想を考えておくと、アンケートの実施時には分析の対象となるデータ自体が特定の意図で決定木分析を行なえるよう調整されているケースがベストです。
特定の商品を購入しているユーザー固有の属性を明確にする場合は、アンケート項目を調整します。商品の購入者に対して性別・年齢・職業・生活スタイル・趣味といった項目からなるアンケートを行うなど、事後に決定木分析を行える形にしておきましょう。
「決定木分析」をアンケート分析で使うには?
決定木分析の具体的な実施について確認してみましょう。決定木分析は、樹形図の一種である「決定木」を使用してデータを分析します。
小売店が、特定商品の販売促進キャンペーンを行い、キャンペーン期間中に来客した顧客に、年齢、性別、職業、過去来店回数といった項目からなるアンケートを行ったとします。アンケートには、100人が回答しました。そのアンケートの集計結果に対して決定木分析を実行したころ、以下のような結果が得られました。

例を分かりやすくするため、二分岐の決定木を使用していますが、決定木分析はそれぞれの階層が複数分岐する多分岐モデルでの分析も可能となります。細かく項目を分けたアンケートを行った場合、年齢や職業といった項目は複数に分岐するためです。
画像の結果を見て、どういったことが読み取れるかを考えてみましょう。最初に確認できるのは、キャンペーン対象商品の購買有無に影響を与えた顧客属性です。最も大きな影響を有している属性は「女性」となります。女性の購買者に対しては「20代~30代」という属性が最も大きな影響を与えていることも読み取ることが可能です。
そして、「女性かつ20代~30代」である顧客には、「主婦」という属性が、そして、「女性かつ20代~30代かつ主婦」である顧客には、「過去来店回数二回以上」という属性が、それぞれ大きな影響を与えていることがわかります。
決定木分析において、決定木の最上位にある分析の目標となる結果を「目的変数」と呼びます。今回の例では「キャンペーン対象商品の有無」が目的変数にあたります。
目的変数を説明する変数は「説明変数」と呼ばれます。このケースでは「性別、年齢、職業…」といった項目が説明変数に当たります。
決定木分析は目的変数に対する影響力が大きい説明変数から始め、影響力の少ない説明変数へと順番に分岐していく点がポイントです。目的変数に対して最も影響力の大きな説明変数の組み合わせを解析していき、階層が下がっていくことを「純度」が高くなる、と決定木分析では表現します。
キャンペーン対象商品を購入した人を分析すると、「女性・20代~30代・主婦・過去来店回数二回以上」という属性の組み合わせをもつ顧客が、他の組み合わせを持つ顧客よりも、もっとも多く商品を購入していることが分かります。
この「女性・20代~30代・主婦・過去来店回数二回以上」という属性を持っている顧客が、最も純度が高いことになります。同様の属性を満たす顧客は、潜在的にキャンペーン対象商品の購入確率が最も高い顧客です。
「女性・20代~30代・主婦・過去来店回数二回以上」という属性を持っている顧客は最も純度が高い結果だけでなく、「女性・20代~30代・主婦・過去来店回数1回以上」属性の顧客、「女性・20代~30代・会社員・過去来店回数二回以上」属性の顧客がキャンペーン対象商品の購入可能性が相対的に高いものと考えられる余地もあります。
他の分析方法と同じように、決定木分析でも分析結果を有効に活用していくためには、データの分析者の有意義な解釈が必要と覚えておいてください。
「決定木分析」をアンケート分析で使う上でのまとめ
決定木分析は特定の目的を達成するために有効なデータ分析方法です。小売点の販売促進のためのアンケートの分析を例にしましたが、決定木分析は、幅広い分野で応用する出来ます。
サービスでの顧客離脱原因特定や、不良品の発生要因の特定、ミスが多い事業部での原因特定など、決定木分析は非常に多くの分野で多様な目的のために役立てられる分析方法です。
マークシートの無料版ってあるの?
無料のマークシートがあるのをご存じでしょうか?企業によっては無料でマークシートを提供してくれているところもあります。
下記ページでは無料版のマークシート用紙・ソフトを取り扱っている会社を調査しました。有料版マークシート用紙・ソフトと無料版の違い、コスパの良いマークシート読み取り機(スキャナ)に関する情報などもまとめています。
無料版マークシートに興味がある方は参考にしてみてください。
記述式にも対応できる
おすすめのマークシート会社2選
スキャネット
引用元:スキャネット公式HP
(http://www.scanet.jp/)
- 集計/採点用ソフトの費用
- 無料ソフトあり※有料ソフト99,000円~
- 取り扱っている
読み取り機の種類
- スキャナ44,000円~
- 導入にかかる最低費用
- 48,180円
教育ソフトウェア
引用元:教育ソフトウェア公式HP
(http://www.kyoikusw.co.jp/)
- 集計/採点用ソフトの費用
- 107,800円~
- 取り扱っている
読み取り機の種類
- OMR※費用は要問合せ
- 導入にかかる最低費用
- 622,600円
【調査対象】
2023/5/8時点、Google検索で「マークシート 導入」と調べ、検索結果に表示された上位50社を選出。
【選定基準】
その中でマークシート、集計/採点用ソフト、読み取り機の金額が明記されている2社をピックアップ。