日別アーカイブ: 2010-05-31

「母数」と「サンプル数」の本来の意味は?

ある日、つぎのようなtweetを見ました。

"ときどき、分母のことを「母数」と表現するリサーチャーがいてすご~く気になる。"

"「サンプル数」も気をつけたい表現。広く出回っている表現なので清濁併せ呑む。"

うむ・・・。なにげに使っているかもしれない。。。
そこで、
このtweetのご本人に「寺子屋で解説してくれません?」とお願いしたところ、快諾いただきました。

ということで今回は、とある市場調査会社に在籍している @slowtempo さん (すでにアカウントが異なっているので削除します)の寄稿をお届けします。

******************************************************************************************************

こんにちは。
今回はご縁があり、@slowtempoが寄稿させていただくことになりました。
よろしくお願いいたします。

まずは簡単な自己紹介を。
大学院卒業後、とある調査会社に職を得て6年になる若手(?)市場調査会社員です。
もともと統計学を専攻していた経緯もあり、データ解析に関連した業務に携わっています。

今回は、この業界に飛び込んでからお仕事をしていくなかで、とくに気になることについてお話をしたいと思います。

それは、「用語の使い方」です。

社内外を問わず市場調査関連の資料・プレゼンを見ていくと、「用語の使い方」に違和感を感じることがあります。その違和感には理由があって、「その用語が本来持つ意味と異なる使われ方をしている」ことによるものです。

本日はとくに、「母数」と「サンプル数」という表現の使い方についてお話をしたいと思います。

◆母数

はじめにお話するのは、「母数」という表現についてです。

「母数」を使った表現として、

  • 「母数がどんどん大きくなるから、この割合はどんどん小さくなって・・・」
  • 「この割合の母数はいくつで・・・」

などと、市場調査業界の内外を問わずよく耳にします。

ここでいう「母数」とは分数の「A/B」の「B」の部分のことを指しているようで、 私たちが小学校時代に算数で習った「分母の数」に相当します。

「うーん、まぁ分母の数って言った方がいいのかもしれないけど、母数という表現でもいいか?」 という気もするのですが、ここは厳密にいきましょう。

上述の文脈で「母数」という言葉を適用するのは誤りです。

それは、統計学において「母数」という言葉には、「分母の数」という意味は存在しないからです。統計用語辞典(芝祐順, 新曜社)によれば・・・

「母数:確率変数の分布を特定している定数で、分布を表す関数の中にはっきりと示されているもの」

とあります。
したがって、「母数」という言葉には「分母の数」という意味は存在しません。
先の例を表現するならば、

  • 「分母の数がどんどん大きくなるから・・・」
  • 「この割合の分母の数はいくつで・・・」

という表現のほうが正確と言えます。

◆サンプル数

もう一つお話したいのが、「サンプル数」という言葉です。
似たような表現に「サンプルサイズ」という言葉もあります。

この2つの表現はともに「抽出した標本の大きさ」の意味で使われることが多いです。 個人的な肌感覚ですが、「サンプル数」という表現が使われる頻度がより多いように思います。

・・・・・・・・・。

まぁこう言った書き出しですので、お気づきとは思いますが、「サンプル数」は統計学では「抽出した標本の大きさ」を表す表現ではありません。「サンプル数」は抽出した標本の「数」を表します。ちょっとわかりにくいですね。具体例をあげましょう。

たとえば、とあるフレームから200サンプルを抽出したときの「サンプル数」はいくつか?
答えは200・・・ではなく、「1」です。
では、AとBという2つのフレームからそれぞれ200サンプル抽出したときの「サンプル数」はいくつか?答えは「2」です。

標本は「観測された数値の集まり」を表す言葉です。したがって、「サンプル数」はその「集まり」の数をあらわします。一般的な調査では抽出は1回ですので、この場合の「サンプル数」は「1」となります。

「標本の大きさ」を表すことばとして適当なのは、「サンプルサイズ」です。 もしくは、そのまま「標本の大きさ」という言葉が統計学では正しい表現といえるでしょう。

ちなみに「n数」という表現もよく聞かれる言葉です。これはすごく独特な言い回しですね。
「n」は標本の大きさを表すことの多い記号です(一方、母集団の大きさは「N」で表すことが多いです)。要は「標本の大きさの数」ということを「n数」という言葉で表現しようという意図なのだと思いますが、スラングに近い言葉なので統計学的に正しい表現とは言い難いと思います。

◆清濁を併せ呑む

ここまで理屈っぽくお話をしてきましたが、「ん~、まぁ統計学ではそうかもしれないけど、世の中で多く出回っている表現なわけだから、どっちでもいいんじゃない?」というご意見もあろうと思います。

えーと、そのご意見には、私も部分的には同意します。
私も、社内外で「サンプル数」という表現が標本の大きさの意味で使われていても、いちいち訂正したりはしません。そんなことをしていたら、コミュニケーションが止まっちゃいますよね(汗)

ただですね・・・
市場調査に携わって、かつその道のプロを標榜するならば、統計学における正しい使い方を最低限「知っている」実務家であるべきなのではないかと個人的には考えています。

調査を円滑に、適切に実施・分析するために重要なのは、非学術的なスキルが圧倒的に重要であるように思います。上述の用語の使い方などは瑣末な問題なのかもしれません。

しかし、科学的に仮説検証、評価を行う市場調査では、統計学の知識も重要です。
正しい統計学の知識を学び、更新しつづけることが、実務家が信頼性を獲得していく上で必要なのではないか。
そう思うのです。

そういったスタンスに立った上で、清濁を併せ呑み、状況に応じて用語を使い分けるのがプロとしてあるべき姿なのではないかと若輩者ながら思う次第です。

最後は理想論になって、恐縮です。。。

あと、私より若い世代のリサーチャーには以上のようなことは伝え続けていきたいな、と思っています。草の根活動ですが、「正しいお作法」として用語の使い方を知っておいてほしいと願うのです。

                                           @slowtempo

****************************************************************************************************

いかがですか?
とくに「サンプル数」は、ほんとによく耳にしますよね。無意識に使ってしまうことも少なくないですし。。。
「サンプル数」については、@slowtempo さんの tweet で紹介されていた ↓ のサイトも参考にしてください。

サンプル数とは何か?
 (独立行政法人 労働政策研究・研修機構HP「コラム」より)

さて、ここで考えておきたいこと。
@slowtempo さんご指摘の、

市場調査に携わって、かつその道のプロを標榜するならば、統計学における正しい使い方を最低限「知っている」実務家であるべきなのではないかと個人的には考えています。

という、ご意見に賛成です。

日々の業務に追われていると、知らない言葉を聞いてもそのままスルーしてしまったり、なんとなくの理解で使ってしまうことが少なくありません。これは、統計用語に限らずですが。
同僚の話やクライアントとの話で出てきた言葉、それが専門的な言葉のようであれば、あらためてきちんと調べる態度は、とても必要なことだと思います。
「本来の意味を知らないまま、慣例的に使う」ことと、「本来の意味を知っていて、慣例的に使うこと」は、まったく異なります。このことは、仕事をしているとだんだんと理解できるようになると思いますが。

たとえば、マーケティングリサーチであれば、↓ のような辞典もあります。

マーケティング・リサーチ用語辞典 マーケティング・リサーチ用語辞典
価格:¥ 2,310(税込)
発売日:2004-12

今回テーマになっている「母数」や「サンプルサイズ」についても、この辞典の中で説明がされています(「サンプルサイズ」は、「標本」の項に載っています)。調べてみてください。

これからも、機会があれば@slowtempo さんに寄稿いただきながら、統計や解析についての理解を深めていきたいなと思っています(が、どうなるか?)。