クロス集計とは?ローデータの実例でわかる作り方と分析の進め方

クロス集計とは?ローデータの実例でわかる作り方と分析の進め方

アンケート結果の会議で、よくこういう言葉が出てきます。

「年代別に見たらどうなりますか?」 「新規ユーザーと既存ユーザーで違いはありますか?」 「満足している人は、どの機能を使っているんでしょう?」

クロス集計は、こうした問いに答えるための基本的な分析方法です。ただし、表を作れば分析になるわけではありません。

クロス集計の目的は、回答を細かく分けることではなく、意思決定に必要な違いを確かめることです。

この記事では、架空のアンケートローデータを使いながら、クロス集計の作り方と分析例を解説します。

クロス集計とは

クロス集計とは、ある設問の回答を、別の設問や属性で分けて集計する方法です。

たとえば、全体の満足度だけを見ると「満足している人は多い」とわかります。そこに「利用頻度」という切り口を加えると、「毎日使う人と月1回使う人で満足度が違うのか」を確認できます。

単純集計とクロス集計の違い

単純集計は、1つの設問だけを集計します。

満足度
- 満足: 14人
- どちらでもない: 6人
- 不満: 4人

クロス集計は、2つ以上の項目を組み合わせて見ます。

満足度 × 利用頻度
- 毎日使う人の満足度
- 週1回使う人の満足度
- 月1回使う人の満足度

単純集計は全体像を見るために使います。クロス集計は、どのグループに違いがあるのかを見るために使います。

クロス集計でわかること

クロス集計で見たいのは、きれいな表ではありません。

次のような違いです。

  • 新規ユーザーと既存ユーザーで、満足度に差があるか
  • 利用頻度が高い人ほど、継続意向も高いか
  • 認知経路によって、購入意向に違いがあるか
  • サポート利用経験がある人ほど、不満が多いか

大事なのは、その違いが次の判断につながるかどうかです。

クロス集計を始める前に決めること

クロス集計を始める前に、まず決めるべきことがあります。

それは、何を判断したいのかです。

「年代別に見たい」は、まだ分析の問いではありません。年代別に見ることで、何を決めたいのでしょうか。

新規ユーザー向けの導線を改善したいのか。既存ユーザー向けの機能を強化したいのか。広告の訴求を変えたいのか。解約リスクを見つけたいのか。

判断したいことが違えば、見るべき切り口も変わります。

先に立てるべき分析の問い

今回のサンプルでは、次の問いを置きます。

利用頻度によって、サービス満足度と継続意向に違いはあるのか。
もし違いがあるなら、どの利用頻度のユーザーに優先して改善すべきか。

この問いがあると、ただ表を作るだけではなく、どの差を見るべきかが決まります。

ローデータで確認する項目

今回使うローデータには、次の項目があります。

  • 回答ID
  • 利用頻度
  • 満足度
  • 継続意向
  • 初回設定のわかりやすさ

「初回設定のわかりやすさ」を入れているのは、満足度が低い理由の仮説を少しだけ探れるようにするためです。

クロス集計に使うローデータサンプル

以下は、架空のSaaSツール利用者24人に聞いたアンケート結果です。

アンケートのローデータ

回答ID利用頻度満足度継続意向初回設定のわかりやすさ
1毎日満足継続したいわかりやすい
2毎日満足継続したいわかりやすい
3毎日満足継続したいふつう
4毎日満足継続したいわかりやすい
5毎日どちらでもない継続したいふつう
6毎日満足継続したいわかりやすい
7毎日どちらでもない迷っているわかりにくい
8毎日満足継続したいふつう
9週1回満足継続したいふつう
10週1回どちらでもない迷っているふつう
11週1回満足継続したいわかりやすい
12週1回不満迷っているわかりにくい
13週1回どちらでもない迷っているふつう
14週1回満足継続したいふつう
15週1回どちらでもない継続したいわかりやすい
16週1回不満やめたいわかりにくい
17月1回どちらでもない迷っているふつう
18月1回不満やめたいわかりにくい
19月1回満足継続したいわかりやすい
20月1回不満やめたいわかりにくい
21月1回どちらでもない迷っているわかりにくい
22月1回不満迷っているわかりにくい
23月1回満足継続したいふつう
24月1回不満やめたいわかりにくい

このまま眺めても、なんとなく傾向は見えます。ただ、ローデータのままだと、どのグループにどれくらい差があるのかは判断しにくい。

そこでクロス集計を使います。

クロス集計表の作り方

まずは、利用頻度ごとに満足度を集計します。

手順1: 行と列を決める

今回の問いは「利用頻度によって満足度に違いがあるか」です。

そのため、行に利用頻度、列に満足度を置きます。

行: 利用頻度
列: 満足度
値: 回答数

表計算ソフトなら、ピボットテーブルで作れます。

手順2: 実数でクロス集計する

まずは実数を見ます。

利用頻度満足どちらでもない不満合計
毎日6208
週1回3328
月1回2248
合計117624

この表を見ると、毎日使う人には不満がいません。一方で、月1回の人は8人中4人が不満です。

ただし、実数だけではグループ間の比較がしにくいので、割合も見ます。

手順3: 割合でクロス集計する

各利用頻度の合計を100%として、割合を計算します。

利用頻度満足どちらでもない不満
毎日75.0%25.0%0.0%
週1回37.5%37.5%25.0%
月1回25.0%25.0%50.0%

グラフで見る利用頻度別の満足度

利用頻度別の満足度クロス集計グラフ 毎日利用では満足75.0%、どちらでもない25.0%、不満0.0%。週1回では満足37.5%、どちらでもない37.5%、不満25.0%。月1回では満足25.0%、どちらでもない25.0%、不満50.0%。 利用頻度別の満足度 各利用頻度の回答数を100%として表示 満足 どちらでもない 不満 0% 25% 50% 75% 100% 毎日 6人 75.0% 2人 25.0% 週1回 3人 37.5% 3人 37.5% 2人 25.0% 月1回 2人 25.0% 2人 25.0% 4人 50.0%
月1回ユーザーでは不満が50.0%まで増え、毎日ユーザーとの差が大きく見えます。

割合にすると、差がはっきりします。

利用頻度が下がるほど、満足の割合は下がり、不満の割合は上がっています。

ここで言えるのは、「利用頻度と満足度には関係がありそうだ」ということです。ただし、これだけで原因までは言えません。

クロス集計の分析例

クロス集計では、差を見つけたあとが本番です。

表を見て「月1回ユーザーの不満が高いです」で止めると、報告にはなります。でも、意思決定にはまだ少し遠い。

次に見るべきなのは、その差がどんな行動につながっているかです。

分析例1: 利用頻度別の満足度を見る

今回の満足度クロス集計からは、次の仮説が立ちます。

利用頻度が低いユーザーほど、サービスの価値を感じにくく、不満を持ちやすいのではないか。

ただし、注意が必要です。

「利用頻度が低いから不満なのか」「不満だから利用頻度が低いのか」は、この表だけではわかりません。

クロス集計は、関係を見つける方法です。原因を確定する方法ではありません。

だから、ここで必要なのは断言ではなく、次の調査や施策につながる問いです。

月1回ユーザーは、どの場面で価値を感じられていないのか。
利用頻度を上げれば満足度が上がるのか。
それとも、月1回利用でも価値が伝わる設計に変えるべきなのか。

分析例2: 利用頻度別の継続意向を見る

次に、利用頻度と継続意向をクロス集計します。

利用頻度継続したい迷っているやめたい合計
毎日7108
週1回4318
月1回2338
合計137424

割合で見ると、こうなります。

利用頻度継続したい迷っているやめたい
毎日87.5%12.5%0.0%
週1回50.0%37.5%12.5%
月1回25.0%37.5%37.5%
利用頻度別の継続意向クロス集計グラフ 毎日利用では継続したい87.5%、迷っている12.5%、やめたい0.0%。週1回では継続したい50.0%、迷っている37.5%、やめたい12.5%。月1回では継続したい25.0%、迷っている37.5%、やめたい37.5%。 利用頻度別の継続意向 各利用頻度の回答数を100%として表示 継続したい 迷っている やめたい 0% 25% 50% 75% 100% 毎日 7人 87.5% 1人 週1回 4人 50.0% 3人 37.5% 1人 月1回 2人 25.0% 3人 37.5% 3人 37.5%
月1回ユーザーでは「やめたい」が37.5%あり、満足度の低さが継続意向にもつながっている可能性があります。

月1回ユーザーは、満足度だけでなく継続意向も低いことがわかります。

これは、優先度を考えるうえで重要です。

もし事業上の課題が「解約率を下げること」なら、月1回ユーザーの体験を詳しく見る価値があります。逆に、課題が「ヘビーユーザーの単価を上げること」なら、毎日使うユーザーを別の切り口で見るべきかもしれません。

同じクロス集計でも、事業課題によって読むべき意味は変わります。

分析例3: 不満の背景を別の項目で見る

最後に、満足度と初回設定のわかりやすさをクロス集計します。

初回設定のわかりやすさ満足どちらでもない不満合計
わかりやすい6107
ふつう5409
わかりにくい0268
合計117624
初回設定のわかりやすさ別の満足度クロス集計グラフ 初回設定がわかりやすい人では満足6人、どちらでもない1人、不満0人。ふつうでは満足5人、どちらでもない4人、不満0人。わかりにくいでは満足0人、どちらでもない2人、不満6人。 初回設定のわかりやすさ別の満足度 各回答グループの人数を100%として表示 満足 どちらでもない 不満 0% 25% 50% 75% 100% わかりやすい 6人 85.7% 1人 ふつう 5人 55.6% 4人 44.4% わかりにくい 2人 25.0% 6人 75.0%
初回設定を「わかりにくい」と答えた人では、不満が75.0%に集中しています。

この表では、「初回設定がわかりにくい」と答えた人の中に、不満が集中しています。

ここから、次の仮説が立ちます。

低頻度ユーザーの不満は、サービス価値そのものよりも、初回設定でつまずいた経験と関係している可能性がある。

もちろん、これも確定ではありません。

ただ、次にやるべきことは少し見えてきます。月1回ユーザーに追加インタビューをするなら、「なぜ使わないのですか」と聞くだけでは足りません。

初回設定で何を期待していたのか。どこで止まったのか。設定後に、最初の価値を感じるまでに何が足りなかったのか。

クロス集計は、こうした次の問いを絞るために使えます。

クロス集計でよくある失敗

クロス集計は便利ですが、使い方を間違えると、むしろ判断を曇らせます。

失敗1: とりあえず全部の項目を掛け合わせる

アンケート項目が10個あれば、組み合わせはいくらでも作れます。

しかし、すべての項目を掛け合わせると、表は増えても問いは深まりません。

先に決めるべきなのは、見たい表ではなく、確かめたい仮説です。

失敗2: 割合だけを見て実数を見ない

「不満が50%」と聞くと大きな問題に見えます。

でも、それが2人中1人なのか、200人中100人なのかで、判断の重みはまったく違います。

割合は比較に向いています。実数は判断の重さを見るために必要です。

失敗3: 相関を原因だと思い込む

今回の例では、利用頻度が低いほど満足度も低く見えました。

ただし、それは「利用頻度を上げれば満足度が上がる」と同じ意味ではありません。

原因を知りたいなら、追加の定性調査、ログ分析、施策検証などが必要です。

失敗4: 差が出たのに次の行動が決まらない

クロス集計で差が出ても、次に何を変えるかが決まらないなら、その分析はまだ途中です。

良いクロス集計は、報告書のページ数ではなく、判断を変えます。

クロス集計を意思決定につなげるチェックリスト

クロス集計を作る前に、次のチェックリストを使うと、分析が迷子になりにくくなります。

分析前のチェックリスト

  • この集計で、どの意思決定を前に進めたいか
  • 比較するグループは、行動や文脈の違いを表しているか
  • その切り口は、ただ見やすいだけではないか
  • 差が出た場合、何を変えるのか
  • 差が出なかった場合、何を保留するのか

分析後のチェックリスト

  • 割合だけでなく実数も確認したか
  • サンプル数は、判断に使えるだけ十分か
  • 差を原因として断定していないか
  • 次に必要な追加調査や検証は何か
  • 事業上の優先度と分析結果がつながっているか

まとめ: クロス集計は「分ける技術」ではなく「判断をよくする技術」

クロス集計は、アンケート分析の基本です。

けれど、本当に大事なのは、表の作り方そのものではありません。

何を判断したいのか。
どの違いを見れば、その判断が少し良くなるのか。
差が見えたあと、次に何を確かめるのか。

クロス集計は、数字を分けるための道具ではなく、問いを絞るための道具です。

表が増えたのに判断が進まないときは、たいてい集計が足りないのではありません。問いがまだ太すぎるのです。

まずは1つの意思決定を選ぶ。そこから、必要な切り口を選ぶ。

クロス集計は、その順番で使うと、ただの表ではなく、チームが次の一手を決めるための材料になります。

テンプレートのダウンロード

この記事で紹介したテンプレートを無料でダウンロードできます。

Excel

クロス集計表テンプレート

アンケート結果のクロス集計に使えるExcelテンプレート。集計関数・グラフ設定済み。

180KB
無料ダウンロード
この記事の著者 山田太郎

フリーランスのWebリサーチャー。検索技術とデータ分析を専門とし、企業のリサーチ支援を行っています。