ホーム | サイトマップ | リンク

ホーム > レポート > その他 > アンケートの設問間の関係を分析する

アンケートの設問間の関係を分析する

主任研究員 長谷川 強

1.はじめに

通常、アンケートを行うときには複数の設問の項目があり、項目に対する回答は相互に関連があるという可能性を想定する。特に、注目している項目の回答結果には、その要因や要素として他の回答に求めようとする、ということがよくある。

そのような場合は、クロス集計表を作って2つの項目の関連を評価する。ところがそれは意外に難しい。2つ項目A,Bの回答が共に「はい」「いいえ」の二者択一であり、Aが「はい」ならBも「はい」、Aが「いいえ」ならBも「いいえ」、というような傾向が明らかである場合(表 1.1) はよいが、それが微妙な配分の場合(表 1.2)に関連がある、もしくはないと言い切ることに躊躇することが少なくない。また、回答が3つ以上の場合はますます評価が困難になる。(こういったクロス集計表を評価するには「カイ二乗検定」という手法があるが、ここでは割愛する。)

さらに、クロス集計表はあくまで2つの項目間の関係だけの評価に留まり、3つ以上の項目の関係性を評価しようとすると、2つのときと比べて一層複雑で項目数の多い表(表 1.3)となり、評価が難しくなる。

これらの課題を解決する手法として、多変量解析の一つである数量化理論を用いる。

表 1.1 評価が容易なクロス集計表の例
表 1.1 評価が容易なクロス集計表の例

表 1.2 評価が容易でないクロス集計表の例
表 1.2 評価が容易でないクロス集計表の例

表 1.3 3設問のクロス集計表の例
表 1.3 3設問のクロス集計表の例

(数値はサンプル数、以下同じ)

2.数量化理論

2.1.数量化理論とは

「数量化理論」とは、非常に大雑把に言うと、回答に数値(点数)を割り付け、その値の大小や合計値で事象を説明しようとする理論である。

本稿では、実際のデータに数量化理論を適用して、その特徴や留意点を述べる。そのデータはある地域で行った観光動態調査であり、その調査項目の一つである観光客の全体的な満足度(以下「全体満足度」という)と他の設問項目との関連を分析することをテーマとする。

このように「満足(した・しなかった)」のような「質的データ」を判断基準(数量化理論では「外的基準」という)として、「個別項目の回答」のような「質的データ」を数量化する手法は、「数量化U類」と呼んで区別している。

2.2.数量化の流れ

ここでは、各項目の回答に点数付け、言うなれば配点を行い、その回答の有無で合計値を求めて、全体満足度の満足「した」「しなかった」を判定できるようにすることを目的とする。例えば、「景観・雰囲気が良かったか」という項目に対して「はい」に1点、「いいえ」に-0.5点、というように配点し、各回答者における各項目の合計値で全体満足度の「した」「しなかった」の判定が出せるようにする。

3.実データへの適用

3.1.個別の満足度との関連
3.1.1.分析対象の概要

計算の元となる理論及び数式化の過程は専門書に譲ることにして、本稿では数量化U類が実用的に使えるか、分析対象に実データを用いて検証する。

アンケートは、全体満足度を含めた9項目について、満足度を6段階で回答する形式である。これらの回答それぞれに配点を行い、合計値を算出する。ある回答者Aの配点例を表 3.1に示す。表中の○印がAの回答箇所であり、その合計値で判定することになる。

表 3.1 ある回答者Aの配点例
表 3.1 ある回答者Aの配点例

※分析の都合上、2値とした。

なお、判定の対象とする全体満足度は「大変満足」「やや満足」と回答したサンプルを「満足した」とし、それ以外(「わからない」、無回答を含む)を「満足しなかった」というように2値に置き換える。Aの場合は「満足しなかった」である。

ひとまずこの配点をふまえた上で、全回答者の配点の合計値を表すグラフを図 3.1に示す。グラフの折れ線のデータは以下の流れで作成した。

  • 全体満足度「満足した」「満足しなかった」で回答者のグループを作る。
  • 「満足しなかった」回答者を満足度の合計値の数値の小さい順に並べる。
  • 小さい順に並んだ回答者の順位(全数を1としたときの割合)を縦軸に、回答の合計値を横軸に折れ線を作成する。
  • 「満足した」回答者を数値の大きい順に並べる。
  • 大きい順に並んだ回答者の順位(全数を1としたときの割合)を縦軸に、回答の合計値を横軸に折れ線を作成する。

図 3.1 回答者の配点合計値と回答者順位(率)の関係(プロット図)
図 3.1 回答者の配点合計値と回答者順位(率)の関係(プロット図)

3.1.2.判定の精度

このグラフを作成することで、2つの折れ線の交点が、回答者の満足度の合計値で「満足した」「しなかった」を判断する境目、と考えることができる(「判別的中点」という)。この境目から左にある、すなわち合計値が小さい回答者は「満足した」グループの判定が成功となる。一方、境目から右にある(合計値が大きい)回答者は「しなかった」グループの判定が成功となる。

同時に、交点より下の回答者は「満足した」「しなかった」の判定がいずれも成功していることから、交点における順位の値を「成功率」ということができる(「判別的中率」という)。

判別的中率は高いに越したことはないが、そもそも2つの折れ線の重なりが小さければ自ずと判別的中率は高くなる。この重なりの小ささ、言うなればグループの「分離度」と連動する数値として「相関比」というものがある。相関比は0と1の間であり、大きいほどグループ分けがうまくできている、と言える。

本稿の例では判別的中率は0.830と0.75を超えておりそこそこの精度があると言えるが、相関比は0.486と0.5を下回っており、この点ではあまり精度が良くない結果となった。

3.1.3.満足度の判定に対する項目及び配点の影響

配点の合計値と配点の関係に着目すると、配点が大きいほど「全体的に満足した」と判定されるようになっている。したがって、項目における配点の最大値と最小値の差(「配点差」)は、回答者の合計値を左右することから、判定との関連度とみなすことができる(表 3.2)。

表 3.2 個別の満足度の配点差
表 3.2 個別の満足度の配点差

※分析の都合上、2値とした。

この表から、「満足度-宿泊施設」「満足度-飲食」は配点差が大きく、他の項目と比較して全体満足度の判定との関連度が大きいと言える。なお、「満足度-旅行中情報」については、全体的な満足との相関が非常に微妙なため、配点の計算結果は直観と逆になっている。一方で配点差は小さく、全体満足度の判定との関連度の小ささが反映されている。

3.2.他の設問との関連
3.2.1.観光資源

全体満足度との関連があるものとして、観光資源に触れる機会を挙げることができる。ここではそれらとの関連を分析する。

アンケートでは、史跡・名所、飲食店、物販店、みやげ物、文化・自然体験などの観光資源を選択肢として列挙し(「その他」を含む全73種類)、触れたものがあれば選択する(複数可)という形式で回答していただいた。回答は各観光資源1つにつき「触れた(行った、買った、体験したなど)」「触れなかった」の二者択一となる。

3.2.2.多重共線性

「史跡名所1」と「風景2」については、配点がそれぞれ逆転した値となっている(表 3.3)。データを確認したところ、「風景2」を訪れた人の99%(=25.8/(25.8+0.3)*100)が「史跡名所1」を訪れていた。その結果、配点差は大きいが、回答者ごとに配点を合算した結果への影響は小さい、という事象が発生している。これは、「多重共線性(マルチコリニアリティ、multicollinearity)」と言われる。分析ではどちらか一方を除外して多重共線性を切り離す。

表 3.3 相関関係にある項目での配点
表 3.3 相関関係にある項目での配点

3.3.全体的な関連

観光資源、個別の満足度に回答者属性(年齢・性別、出発地など)を加え、改めて分析した結果として、設問の配点差における上位10項目を表 3.4に示す。ここから、各回答との相対的な関連度の差を知ることができる。たとえば、「満足度-宿泊施設」と「満足度-飲食」の配点差は満足度以外の他の回答に比して大きく、表 3.2における分析と同じ傾向である。ここから、「全体満足度は飲食、宿泊施設と関連が最も高く、他の要素との関連は相対的に小さい」ということができる。なお、判別的中率は0.899とまずまず、相関比は0.532で一応の精度を確保した。

表 3.4 全体的な項目の配点差 上位10項目
表 3.4 全体的な項目の配点差 上位10項目

一般的に、説明変数を増やせば増やすほど判別的中率及び相関比は増加する。ただし、計算の所要時間は加速度的に長くなること、変数間に相関があると多重共線性が発生して、各回答と全体満足度の関係を判断することが難しくなることなどのデメリットも生じる。

4.まとめと今後の課題

以上のことから、アンケートを全体的に分析、評価する手法として数量化理論(U類)が実用面から適用が可能であることを明らかにすることができた。一方で、多重共線性とそれに伴う説明変数の選び方など注意すべき点があることも明らかになった。 説明変数の選び方に関して実務においては、説明変数の追加・削除、再計算、他の説明変数への影響をチェック、という作業の繰り返しになる。このプロセスに、改善の余地があると考える。

それらをふまえながら、クライアントにより良い情報を提供できるよう、今後も研鑚に努めたい。

参考文献:

  • 涌井良幸、涌井貞美「多変量がわかる」技術評論社,2016
  • 菅民郎「多変量解析の実践(下)」現代数学社,1993
  • 酒井隆「図解 アンケート調査と統計解析がわかる本 [新版]」日本能率協会マネジメントセンター,2015
  • 岡本安晴「いまさら聞けないPythonでデータ分析」丸善出版,2019
  • 堀田敬介「判別分析・数量化U類・数量化V類」, 文教大学 Hotta Lab. 講義資料 最新版資料 倉庫 (https://www.bunkyo.ac.jp/~hotta/lab/courses/2003seminar/ch4-4_5_hotta.pdf)
  • 福井正康・細川光浩「社会システム分析のための統合化プログラム7 ― 多変量解析 ―」福山平成大学経営学部紀要 (https://www.heisei-u.ac.jp/ba/fukui/pdf/analysis7.pdf)

(2021.12)
(執筆者の所属、役職等は発表当時のものです)

このページのトップへ