『統計学が最強の学問である』2013/1/25
西内 啓 (著)
最新の事例と研究結果をもとに、統計学の世界を分かりやすく紹介してくれる本です。
どんな権威やロジックをも吹き飛ばして正解を導き出す統計学の影響は、現代社会では強まる一方です。
また最近は、「ビッグデータ」、「データマイニング」などの統計関連の用語をよく聞くようになりましたが、いまいち意味がピンとこないという人は多いのではないでしょうか(汗)。(もっとも「データマイニング」の意味は、「有用でかつ既知でない知識をデータから抽出する自明でない一連の手続き」だそうなので、ピンとこなくても不思議ではないと思いますが……汗・汗)。
「統計学の本」というと、「数式・意味不明な用語の羅列」がすぐに連想されて、読む前から挫折しがちですが(汗)、意外なことに、この本にはあまり「数式」が出てこないので、とても読みやすく、一般の人が「統計」に関する基礎知識や、その利用上の心構え(注意点)を知るのに、とても役立つと思います。
特に参考になると思うのが、ここで紹介されている「サンプリング」の考え方。「統計」をとる時には、対象のデータを「全数」調査するのが理想ですが、例えば「日本人は週に1食以上、白米を食べる」ことを確かめるのに、1億人以上調べるというのは現実的ではありません。もっと少ない人数の調査でも概要を調べるのには十分で、「サンプリング調査が正しくない確率(誤差)を計算し、その誤差が十分低いと思われる人数を調査」すればいいのです。そうすれば、1億人アンケートよりずっと少ない費用で、実用に耐えうる調査結果を得られます。
最近は、コンピュータの処理能力が向上したので、コンピュータに蓄積された膨大なデータ(ビッグデータ)から、コンピュータ自身に「傾向などの概要分析」をさせることが可能になってきましたが、その内容をより深く理解するためにも、「サンプリング」の考え方は重要だと思います。適切にサンプリングされたデータを、人間が詳細に調べることで、何らかの傾向を直感的につかむことが出来るからです。分析対象データ数があまりにも多いと、人間が個別に見たり分析したりするのに時間がかかり過ぎて、細かい傾向を見逃してしまいがちですが、少量データだとかえって傾向を見つけやすい(散布図にプロットしたデータを実際に見ることで、データをカテゴリー分けできることに気づくなど)ので、よりきめ細かく仮説検証できるようになると思います。
統計学は、これからも経済学・経営学、医学・生物学、社会学・心理学をはじめ、あらゆる分野で重要となるでしょう。ハーバード大学のメディカルスクールで使われている統計学の教科書の冒頭には、次の文章があるそうです。
「1903年、H.G.ウェルズは将来、統計学的思考が読み書きと同じようによき社会人として必須の能力になる日が来ると予言した」
さすがはSFの父、慧眼ですね!
* * *
なお社会や科学、IT関連の本は変化のスピードが速いので、購入する場合は、対象の本が最新版であることを確認してください。
<Amazon商品リンク>