公開日:
|更新日:
マークシートを使ったアンケート分析に主成分分析を活用
アンケート分析手法「主成分分析」とは?
集計されたデータを分析する際は、求めたいデータに応じてさまざまな方法で対応します。分析手法は得意とするデータやジャンルがあり、アンケート結果の分析で使う場合は、個性についてよく理解しておく必要があります。このページでは、データ分析手法で、代表的なものの一つである主成分分析について解説します。
データは集計した項目の数が増えれば増えるほど、全体の傾向や印象を一目で把握できなくなっていきます。アンケートの結果を集計する場合に、アンケートの項目数が30項目や50項目を超える場合、アンケート結果で必要な情報は集まりますが、全体や個別のデータがどういったことを指しているのかが一目で把握が難しくなってしまいます。
データが持つ項目数が2~3個である場合は、データ全体を座標図といった視覚的に分かりやすい形でアウトプット出来ます。項目数が少ない場合は、データの有意義性が少ないものになりかねません。
もし、自社製品に対する顧客の印象を調査するためのアンケートが、「製品Aは優れていると思いますか」、「製品Aの価格設定は妥当なものだと思いますか」といった2つの項目しか持たない場合、アンケートの結果がもつ意義は、より多くの項目を持つアンケートと比較すると低いといえます。
データを有意義なものにするには、データの項目数を十分に増やすことが望ましいです。ただし、項目数が大きくなればなるほど、データの解釈が難しくなるというジレンマがあります。主成分分析はこうしたジレンマの解決に有効な分析手法です。主成分分析は、データ全体がもつ項目の数をより少なくすることでデータの全体をより把握しやすいものにすることが出来るからです。
分析対象のデータがもつ各項目から、データ全体とより深い関連をもつ「主成分」を合成あるいは抽出しながら分析を行います。こうした、主成分分析が行う「主成分の抽出」によるデータの項目数の削減のことを「縮約」と呼びます。
個々のデータ間の距離をもとに、より近いデータ同士を一つのグループとしてまとめて扱うことでデータ全体を分析していくクラスター分析も近い方法です。クラスター分析も主成分分析も、複雑なデータを簡単に把握できるようにする手法として共通点を持ちます。ですが、主成分分析はあくまで、データの持つ項目を対象とするものです。したがって、主成分分析にはクラスター分析と異なり、個々のデータを直接対象としないため、データをより多彩に活用できるというメリットがあります。
「主成分分析」をアンケート分析で使うには?
主成分分析におけるデータの項目の数を減らす作業「縮約」は、一般的には既存の項目をもとにして、新しい項目を合成することになります。
例えば、ある高校で一定の学年の生徒を対象として、選択科目を含む合計10科目の試験を実施したとします。その際、全科目の合計点をただ比較するだけでは、生徒一人ひとりの学力を正しく把握できません。それぞれの科目によって平均点・得点分布・科目ごと試験者数が異なるからです。生徒一人ひとりの学力を正しく把握するためには、例えば、それぞれの科目ごとの偏差値算出が必要になります。
精度を高めていくのであれば、科目ごとの偏差値から文系科目および理系科目での合計偏差値や全科目を通じての総合偏差値を算出することによって、生徒全体で1人の生徒がどの位置にいるのかを正確に把握できるようになります。
まとめると、それぞれの科目ごとの点数を最終的に「理系科目での偏差値」「文系科目での偏差値」「総合偏差値」という項目に「縮約」することで、試験結果全体の把握がより容易になっています。主成分分析の活用として、まず覚えておきたい考え方です。
主成分分析の際に合成される新しい項目は「主成分」と呼ばれます。主成分のポイントは、個別データとの偏差が少ないものであることです。分析ソフトを使用して主成分分析を行うと、他のデータと偏差が少ない新しい項目が主成分として自動的に総合されます。
とはいえ、一つの主成分だけではデータの解釈も一次元的なものとなり、一部のデータが捨てられることになってしまいます。実際の分析では複数の主成分が必要です。分析ソフトを使用すると、複数の主成分がさまざまデータと偏差が少ない順番に合成されます。
主成分をいくつ採用するかは、主成分の固有の情報である固有値と寄与率、主成分負荷量をもとに決定します。固有値は、主成分が保持している情報の大きさを純粋に数値化したものです。寄与率は、主成分がもつ情報量の大きさをデータ全体がもつ情報量に対する比率で表したものです。主成分負荷量は、データが持っているオリジナルの各項目に対する主成分の係数です。主成分負荷量ではそれぞれのオリジナルな項目が合成された主成分にどれだけの影響を与えているかを示しています。
例外もありますが、一般的には固有率が1以上の主成分を、累計の寄与率が80%を超えるまで採用する場合が多いようです。
分析ソフトを使用して主成分を合成した場合、一番最初に合成される最も固有率と寄与率が高い主成分は分析対象のデータの全体的な傾向を表しているため、理解しやすいといえます。ただし、他の主成分が具体的にどのような内容を持っているのかは、分析者の判断にゆだねられます。
具体例として、ある飲料品メーカーが複数の新製品に対する顧客の印象を調査した際のことを考えてみましょう。
主要な商品ごとに「のどごしはよいか」「爽快感はあるか」「香りはよいか」といった複数の項目からなるアンケートを実施したとしましょう。アンケートには500件の回答が寄せられました。主成分分析にかけたところ、合計の寄与率(累積寄与率)が80%以上となる2つの主成分が合成されました。
第一の主成分は「商品の満足度」、どのような基準であれ、商品をおいしいと思ったか、商品に対して満足感を感じたか、といったことを示しています。ただし、第2の主成分が何を意味するのかは、第2主成分上でのデータの分布から読み取らなければなりません。分析結果を解析した結果、水やサイダー、麦茶といった商品が第2の主成分において高い位置にあることから、第2主成分は「のどごし」と解釈できると明らかになりました。
「主成分分析」をアンケート分析で使う上でのまとめ
主成分分析によって得られる結果は、多くの情報を含んでいます。上記で挙げた飲料品メーカーの例をもう一度使ってみましょう。
主成分分析の結果から「のどごしが悪い」と消費者に受け止められている商品は、「商品の満足度」も全体的に低い、という結果が読み取られた場合、寒い季節に販売する商品に関して全体的な見直しが必要であるという結論を得ることができるかもしれません。
もしかすると、似たコンセプトを持つ2つの商品で片方が顕著に「のど越しが良い」と消費者から判断されている場合、両者の違いを検討することは重要なものとなるはずです。
クラスター分析と同様、主成分分析は「教師なしの分析」です。事前に分析の基準を用意する必要がなく、与えられたデータを分類していく過程を可視化するものです。クラスター分析と同様、分析結果の解釈はデータを分析する人のスキルが大事になります。ですが、上手く使うことで多くの可能性を持った分析法であるといえます。
マークシートの無料版ってあるの?
無料のマークシートがあるのをご存じでしょうか?企業によっては無料でマークシートを提供してくれているところもあります。
下記ページでは無料版のマークシート用紙・ソフトを取り扱っている会社を調査しました。有料版マークシート用紙・ソフトと無料版の違い、コスパの良いマークシート読み取り機(スキャナ)に関する情報などもまとめています。
無料版マークシートに興味がある方は参考にしてみてください。
記述式にも対応できる
おすすめのマークシート会社2選
スキャネット
引用元:スキャネット公式HP
(http://www.scanet.jp/)
- 集計/採点用ソフトの費用
- 無料ソフトあり※有料ソフト99,000円~
- 取り扱っている
読み取り機の種類
- スキャナ44,000円~
- 導入にかかる最低費用
- 48,180円
教育ソフトウェア
引用元:教育ソフトウェア公式HP
(http://www.kyoikusw.co.jp/)
- 集計/採点用ソフトの費用
- 107,800円~
- 取り扱っている
読み取り機の種類
- OMR※費用は要問合せ
- 導入にかかる最低費用
- 622,600円
【調査対象】
2023/5/8時点、Google検索で「マークシート 導入」と調べ、検索結果に表示された上位50社を選出。
【選定基準】
その中でマークシート、集計/採点用ソフト、読み取り機の金額が明記されている2社をピックアップ。