月別アーカイブ: 2010年7月

統計を学ぶ本

実は、日経BP社のWEBサイト「BPnet ビズカレッジ入門講座:仕事に役立つデータの読み方・伝え方」(→こちで)で、3ヶ月の短期連載を始めています(2010.7~2010.9の連載です)。

(ふだん調査やリサーチに接することの少ない人へむけての入門講座なので、このblogの読者の方には、あたりまえすぎる内容だと思います。
また、限られた字数の中で、できるだけ数式等を使わずに、初歩的なことをお伝えするという内容なので、正直、結構苦戦しているという状況でもあり・・・^^; )

そこで、この講座を進めるにあたり参考にした書籍を、一度紹介しておこうと思います。
統計の入門書、それもできるだけ数学寄りではなく、ビジネス向け、学生向けに書かれたものを探している方の参考になればと思います。

◆『現場で使える統計学』(豊田裕貴)

現場で使える統計学 現場で使える統計学
価格:¥ 1,470(税込)
発売日:2006-09-28

まずは、このblogでもすでに紹介しているこの本です。詳しい内容は、こちらのエントリーをご覧ください。
「とにかく、統計とかよくわからん。統計の厳密さとかはいいから、とっかかりがほしい」という方が、一番最初に読む本としては、おすすめできるのではないかと思います。

◆『文系でもわかるビジネス統計入門』(内田学他)

文系でもわかる ビジネス統計入門 文系でもわかる ビジネス統計入門
価格:¥ 1,890(税込)
発売日:2010-02-26

つぎは、こちらの本。
「早稲田大学オープンカレッジの大人気講座の完全書籍化!」とあるように、現場で練りこまれているだけあって、わかりやすい本だと思います。適度に数式を使いつつ、理論導出の過程も例を中心にていねいに書かれています。
とくに、統計の中でもわかりにくいと思われる(自分だけでしょうか?・・・)、推測統計のパートは、この本でだいぶ理解ができたと感じました。
さらに、この本ではEXCELでの活用まで触れているのが、実用的です。

◆『心理統計学の基礎』(南風原朝和)

心理統計学の基礎―統合的理解のために (有斐閣アルマ) 心理統計学の基礎―統合的理解のために (有斐閣アルマ)
価格:¥ 2,310(税込)
発売日:2002-06

そして、この本。
前の2冊に比べれば、数式の展開が多い本です。しかし、すこしは統計的な考え方に慣れてきた、もう少ししっかりと統計の考え方を理解したい、という方にはおすすめできる本です。
はじめにで、つぎのように記述されています。

本書は、基礎的な内容から、現在の心理学の研究論文を読み解くには不可欠な「重回帰分析」、「分散分析」、「因子分析」、「共分散構造分析」など、比較的高度な方法まで取り上げて、それらが統合的に理解できるような解説を試みました。また、「因果関係」、「区間推定と検定の関係」、「自由度」、「偏回帰係数の解釈」、「平方和のタイプ」、「斜交因子解」など、ひととおり心理統計を学んだ人でも理解が難しいと感じたり、誤解されることが多い事項を重点的に取り上げました。

マーケティングリサーチの分析をすることがある方なら、おなじみの言葉が並んでいると思います。
調査報告書を読むだけでなく、自身で分析をすることがある人は、この本に書かれていることについては理解をしておく必要のある内容だと思います。(そして、個人的にも、再度この本を読み直さないと、と思ったのですが・・・)

◆『統計学を拓いた異才たち』(デイヴィッド・ザルツブルク)

統計学を拓いた異才たち(日経ビジネス人文庫) 統計学を拓いた異才たち(日経ビジネス人文庫)
価格:¥ 1,200(税込)
発売日:2010-04-02

最後に、少し毛色の変わった本書です。
少しでも統計学に興味をもたれたら、この本を読んでみるとおもしろいかもしれません。日頃接している統計が、どのように生まれてきたのか、どのように展開してきたのか、といったエピソードで語られた読み物です。この本を読むと、統計の背景にある本質を理解できるかもしれません。
(そして、文庫本になったということは、それなりの読者がいたということでもあると思います)

さて、入門編としての統計関連の本を紹介してきましたが、最後の最後に、ぜひ読んでいただきたい論文があります。
それは、『マーケティングリサーチャー』最新号(112号)に掲載されている首都大学東京・朝野先生の論文です。

『マーケティングリサーチャー』112号もくじ(JMRA)

リサーチ会社に入ると最初に教えられるであろう標本調査や推定の理論が、マーケティングリサーチにおいては、どのような矛盾をはらんでいるのかが述べられています。
実は、調査理論には矛盾が多いことを感じていた時に、朝野先生のこの講義を大学院で受け、得心がいったという経験があります。
日本マーケティングリサーチ協会(JMRA)会員社の方であれば、会員ログインページより、本文を読むことができると思います。
また、日経テレコンでも『マーケティングリサーチャー』のバックナンバーを検索できますので、そちらで読むこともできます(反映のタイミングが、よくわかりませんが・・・)。

今回紹介した本が、少しでもみなさんのお役に立てばいいのですが。。。。
また、「この本、おすすめ」という本があれば、コメント欄で、ぜひご紹介ください!




「NHK大相撲名古屋場所生中継」問題から考える

NHKが大相撲名古屋場所を生中継するのかどうかという問題が、データについて考えさせられるので、久々に。

こちら ↓ の記事について、みなさん、どう思いますか?

「楽しみにしていたのに」NHKに反響2000件「中継すべき」が反対を上回る(iza:2010/7/7~リンク切れです)

簡単に整理すると、まず以下の事実があったと。

先月14日から会見直前の6日午後4時半までにNHKに寄せられた意見は約1万4000件で、「中継反対」が66%(約9400件)、「中継賛成」が14%(約2000件)だった。

これを理由のひとつ(=視聴者からも厳しい意見が多い)として、NHKは大相撲名古屋場所の生放送中継をしないことを決めたのですが、それに対して、

NHK広報局によると、意見は福地茂雄会長が記者会見を開いた午後4時半から午後10時までの集計。電話やメールなどで寄せられた約1200件のうち、「中継すべき」は44%を占め、「中継反対」の20%の倍以上となった。

というものです。

単純に見てしまうと、NHKの生中継中止の会見をはさんで、「中継反対」という意見が66%から20%へ減少し、「中継賛成」が14%から44%へと増加した、ということになります。
この数字だけ見せられると、なんと世の中は・・・、という印象を持ってしまいそうです。とくに、最近の内閣支持率の急激な変動などとあわせて考えると、なおさら、「ほら。世の中の意見なんてこんなもんさ。当てにならない」、あるいは、「調査って、ほんとひどい。信用ならん」などということを感じる人もいるでしょう。

ほんとに?、そうなの?。
?マークが頭の中を駆け巡ります。。。

結論を先に言うと、ここに表れている数字は、『世論の曲解』の菅原先生が tweet されていたように、「世論ではなくて反応ですね。不利益を被る側が反応するのが通常なので」ということなのだと思います。

まず確認しないといけないのは、ここで呈示されているデータは「電話やメールなどでよせられた意見」、つまり「NHKに対して(強く?)意見したい人が、実際にNHKに対して言った意見」を元に%を算出しているという点です。
このような背景の下での「反対66%」という数字の意味は、「自らNHKに物申した人の中では、中継反対の人が66%だった」ということで、決して視聴者全体の中の割合でも、相撲に興味がある人の中の割合でも、ふだん相撲を見ている人の中の割合でもない。このことを忘れてはいけないと思います。

そして、「満足した人より、不満な人の方が他人に話をする割合が高い」というデータがあったと思います。
(80年後半頃に、顧客満足の背景として繰り返し語られていたデータなのですが、出典が思い出せません・・・。満足→5人に対し、不満→10人くらいだったように記憶しているのですが)
このことに照らして考えると、「自ら意見を言う人は、相対的に不満な人が多い」ということが考えられ、NHKに寄せられた意見の中で「反対」の立場をとる人が多くなるのは当然の結果だともいえるでしょう。
つまり、NHKが中継中止を表明するまでは「中継反対」の人の意見が多くなり、同様に、中継中止決定後は「中継中止に反対=中継賛成=44%」が多くなる。結果、見かけの数字では逆転現象を起こすのも、これまた当然の結果といえるでしょう。

つまり、これは「(いわゆる)調査」ではないし、このような結果が出てくるのは、ある意味、当前の結果であって、このデータを中継中止の理由のひとつとして示したNHKの考え方に違和感がありました。(そして、中継中止後の状況をあえて記事にするのもどうなの?、と報道する側のスタンスにも疑問を抱いたのですが・・・)

もうひとつ、「シンプソンのパラドックス」という問題があります。

「集団を2つに分けた場合にある仮説が成立しても、集団全体では正反対の仮説が成立することがある」(Wikipedia)というものです。
今回の相撲中継問題にあてはまるかどうか、正直なところ自信はないのですが、データ分析の際に、このようなパラドクスがあるということを、ついでに覚えておいていただければ。

とはいえ、私にこのパラドクスを詳しく説明する力量はないので、サイトをいくつか紹介しておきますので、こちらを参考にしてください。
(ただし、煙に巻かれたような感じを持つかもしれませんが・・・)

シンプソンのパラドクス(Wikipedia)

最後に。

今回のテーマからすると、“(いわゆる)量的調査”に基づかないデータ、たとえばコールセンターへの意見や、blogとか、コミュニティとか、twitter とかのソーシャルメディア上の意見についてはどうなの?、分析しても意味ないと言うの?、という疑問をもつ方もいるかもしれません。
そうではありません。これらのデータも十分に有効なデータだと思っていますし、へたな“調査”に基づいたデータよりも、リッチな内容で、多くの知見を得ることができる可能性があります。
むしろ、たとえ一人の意見であり、つぶやきであったとしても、商品改良やイノベーションのきっかけになることは十分ありますし、粗末な量的調査データよりも、商品改良やイノベーションに寄与する可能性は高いと思います。

ただし、意見を単純に数字に置き換えること、とくに賛否の比較をすることについては、今回のような背景=言いたい人が言っている意見である、ということは踏まえておかないと危険だと思います。
一方で、「不満」の内容を項目レベルで整理し、大小を比較することについては、同じ基準の中での比較になると考えることもできるので、賛否の比較に比べると、素直にデータを読むことができるでしょう。
(ここで、ひとつ気になる点を追加。同じ「意見を言う回路」であっても、電話をする>メールをする>blogを書く>コミュニティサイトへ書き込む>twitterで書く、というように意見を言うことについての障壁は低くなると思うので、すべてのチャネル、メディアに対し、単純に今回の背景を当てはめられない、ということも言えるかもしれません)

また、ある意見を参考にするにあたっては、「どのような人が言っているのか」「どのような文脈で言っているのか」ということも、あわせて理解することも大切ではないでしょうか。
今回のNHK問題については社会的なテーマであるため、マーケティング的な視点からだけ見るのはそぐわないのですが、「中継反対」を言っている人がどのような人なのか、たとえば、ふだんから相撲を見ているのか、見ていないのか、といった背景を理解するだけでも、意思決定は異るかもしれません。

NHKの大相撲中継問題についての記事から、話は拡散気味に、ずいぶん長いエントリーになってしまいました。。。
ただ、このようにデータを扱った記事については、ほんと?、背景は?、などを考えるくせをつけ、そこからふだんの仕事に繋げていくのも、大切なことですよね。
(6月twitterまとめは、近日中に・・・)