統計学は、要するに統計を取ったものを数学的に証明するものなので、クラスでも、アンケート調査みたいなのをよくやります。先日やったのは「青、赤、黄色のうち、何色が好きか」というもの。実際に調べる前に、
「青が好きな人は全体の60%位だと思う」
など、予測を立てます。60%が青で、30%が赤、10%が黄色、という予測を立てて、結果もほとんどそのとおりになりました。黄色を選んだのはわたしひとり。黄色って不人気なんですねー。
これをやったあとで、教えてもらったんですが、公式に当てはめて計算する際、最後の選択項目(この質問で言ったら「黄色」)は常に「その他」とみなすそうで、「黄色」の代わりに「その他、どれでもない」という項目でもいいんだそうです。ちまたでよく見るアンケート調査の結果がグラフ化されたものの最後の項目は「その他」や「わからない」であることが多いですよね。そういうことなんだと思います。そして、黄色を選んだわたしははみだしもの・・・寂しいようなトクベツなような。
これのあとで、「1,2,3,4のうち、どの数字が好きか」というものもやったんです。クラスメイトが、
「これもどれかが『その他』にあてはまるんでしょ?ひとつ多いよね」
「わたしは1、4、2&3だと思う。1と4は最初と最後の数字だからみんながそこに反応しそう」
「でも、『好きな数字』って誰もが持ってるから、ランダムサンプルとは呼べないと思う」
「ルーレットみたいなランダムなものだから予測は25%ずつじゃない?」
と色々言っていました。難しいことは省きますが、予想は各数字25%で考えます。みなさんだったらどれを選びます?
「じゃあ調べてみよう、1が好きな人?」
予想に反して1が好きな人はクラスでひとり。2と4は2割強。そして、予想を大きく反して3を好きな人がクラスの6割。誰もが「3で手を上げるのは自分だけだろう」と思っていたフシがあり、顔を見合わせてびっくりして、そのあと苦笑いになっていました。かくいうわたしも3で手を上げたんですが、「黄色ではみだしものだったから、3もそうかもしれないなー」と思っていたのですよ。
「ハイ、というわけで結論はこうでーす」
と、みんなビックリなのに、先生だけが楽しそう。
「僕は毎学期4つずつクラスを持つけれど、いつも同じような結果になるんだよね」
と言いながら切り替えたモニターには、
In fact, people selected the number 3 significantely more than expected.
(予想よりも3を選ぶ人が多い)
と・・・。またみんなビックリ。毎回こういう結果になるそうですが、
「理由を説明できるのは、きっと統計学じゃなくて、心理学の分野になると思う」
とのこと。
こういうの、もっと昔にわかっていたら仕事で使えたなあと思いました。客層とか、売れ筋を調べるのとかに。次にやる仕事では役立てたいな(そのときまで覚えているかわからないけど)。