日別アーカイブ: 2007-07-16

数字は怖い・・・(集計ベースの話)

blog 「とみざわのマーケティング思索ノート」から。
(「マーケティング千日回峰之記」というblogを書かれていた方の新blogです。千日回峰は無事、万行となられたようです。千日の間、一日も欠かさずにエントリーを続けられたことに、敬意を表します。すごいです。)

『リサーチャーとファシスト』という記事がアップされています。題名からは、よくわからないと思いますが、リサーチデータを読む際に注意しないといけないポイントが示されていると思いますので、ご紹介します。

まずは、発端となった記事から(上記blogからの孫引です)。

パスモを持っている人は全体の19.7%。うち64.3%がスイカも持っていた。両方持つ人の48.3%が交通機関によって2種類のカードを使い分けていた。
(日経朝刊07.7.15より)

さて、この記事の第一印象はどのようなものですか?
何も考えずに、すっと記事を読んでしまうと、「こんなに多くの人が、カードを2つも持って使い分けているの?」と感じませんか?
よーく読むと、これは完全に誤読だということがわかります。正しい数字の読み方をすると、どういう結論になるのか?少しご自身で考えてから、「とみざわのマーケティング思索ノート」をご覧ください。グラフも提示して、とてもわかりやすく説明されています。

以前、「シニアって誰ですか?」で、調査対象をどうするのかを、きちんと考えないといけないという趣旨のエントリーをアップしています(その後、調査結果とはまったく異なる事実を示す記事が出されています。コメント欄にリンクを掲示していますので、興味のある方はご覧ください)。
しかし、調査がしっかり行われたとしても、こんどは結果のデータをきちんと読むことができないと、これまた、意味がない。とくに、この事例のように、どんどんベース(集計を行うときの分母)を絞っていくような項目では注意が必要です。

なぜ、このことをあえて取り上げるかというと、WEB調査が全盛だからこそです。
WEB調査の調査システムは、回答対象者を設問ごとに、システム的に限定していくことができます。このシステムは、複雑な設問を行う上では、とても有用なシステムです。回答者は、とりたてて意識をすることなく、自分が答えるべき設問にのみ回答を行うことができますので。
ただ、これが集計結果を見る上での落とし穴になる場合があります。基本的に、このシステムでは、「回答者ベース」のみでの集計がアウトプットされることが多いようです。となると、事例の記事のように、「Aと答えた人は●%。そのうち、Bと答えた人は▲%。また、その中でCと答えた人は■%」というようなデータの読み方をするようになってしまいます。元々の全対象者ベースで、何%だったのかという数字を意識できなくなってしまいます。
結果、「印象としての数字」のみが一人歩きを始める・・・。

例をひとつあげましょう。
よく、商品のパフォーマンスを捉えるために、認知率・購入経験率・現在購入率という項目を設定しますよね。
このとき、集計結果はおそらく、

  • 認知率=全サンプルベース
  • 購入経験率=認知者ベース
  • 現在購入率=購入経験者ベース

で計算されている場合が多いのではないでしょうか?
もちろん、この数字を見ていくことも、重要な意味があります(ここでは、詳しくは説明しませんが)。
ただ、この「現在購入率」をそのまま、「現在、この商品を購入している人は、●%です」とやってしまうと、大きな間違いになります。基本的には、全サンプルベースで数字を計算しなおさないと、マーケットでのシェアにはなりません。

もしかしたら、このblogをご覧いただいている皆さんにとっては、「あたりまえ」のことかもしれませんが、他の人が提示するリサーチデータを読む時など、気を抜くと、こんな数字を読まされていることがあるかもしれません。

データを読む際には、「調査の設計は?=誰を対象にしたリサーチ?」と同時に、でてきたデータについても「集計のベースは?=誰の回答?」ということを、常に意識して結果を読むようにしたいものです。