『社会科学のための統計学入門 実例からていねいに学ぶ (KS専門書)』2022/6/23
毛塚 和宏 (著)
社会調査に携わるすべての人が知っておくべき統計学の基礎を、親しみやすい題材を実例として学べる本で、主な内容は次の通りです。
第0章 イントロダクション
第I部 コア
第1章 データを集める
第2章 データをまとめる
第3章 関連を捉える
第4章 関連を疑う
第5章 データから推測する
第6章 データから確かめる
第II部 理論
第7章 コイントスで社会を見る
第8章 集まったデータを表現する
第9章 推定が満たすべき条件
第III部 手法
第10章 社会の下流化は起こっているか
第11章 継承される格差を検討する
第12章 世界の男性の家事事情
第13章 年収と年齢の関係
第14章 ワイン評論家を出し抜く方法
第IV部 終わりに
第15章 統計学の応用とこれから
*
「はじめに」には、次のように書いてありました。
「本書は3部――コア・理論・手法――に分かれています。コアでは、社会科学の統計学を理解する上で基礎となる内容を扱います。理論では、統計学を支える確率の理論を扱います。手法では、具体的な分析手法を実際のデータを交えながら学びます。」
まず「第0章 イントロダクション」では、統計学には、「要約」「説明」「検証」「予測」の4つの機能があることや、データ分析には主観が入りがちであることが指摘されていました。でも「主観を完全に排する」ことは不可能なので……「完全な客観性を得るために頑張って中立的になる」のではなく、「自分の主観・立場を明確にしておくこと」が大事……だそうです。
「第I部 コア」の「第1章 データを集める」では、データの集め方としては無作為抽出が望ましいこと、質問方法を熟慮することが大切だと書いてありました。
「質問方法」は「概念を捉える」ものとし、「質問の仕方に気をつける(調査により捉えたい概念をバイアスが少ない状態で捉えられているか)」べきだそうです。具体的には、「難しい言葉を避ける」、「あいまいな言葉を避ける」、「キャリーオーバー効果(質問順によって回答が歪む)に注意する」、「ダブルバーレル質問(ひとつの質問に異なる方向性が混じっている)」に注意する、などだとか。
続く「第2章 データをまとめる」では……
「(前略)どんなデータを用いるにせよ、分析をする際は度数分布表を出力するクセをつけておきたい」
……統計分析では、データを表やグラフにして、じっくり眺めることは、データの本質を捉えるために本当に大事だと思います。
そして「第3章 関連を捉える」では、クロス表、相関係数、分散分析などが、「第4章 関連を疑う」では、疑似相関(見かけの相関)などが、事例とともに解説されていました。
そして「第5章 データから推測する」では、「社会調査で得られる平均値(標本平均)は、確率的に変化するもの」として、次のように言っています。
「いうなれば、社会調査をおこなうことは、1回分のくじ引きのようなものである。社会調査をおこなうたびに、異なる平均値(標本平均)を得る。この平均値の得られ方には、なんらかの法則(=確率的な法則)があることはわかっている。そこで、社会調査1回分の結果と確率的な法則をうまく組み合わせて、母平均の推測をおこなうのである。」
さらに「第6章 データから確かめる」では……
「(前略)検定は、自分の設定した仮説が母集団で成立するか否か、確かめる方法である。推定の場合と同様に、得られるサンプルが確率的に変わるので、仮説の妥当性を判断するにも確率を考慮しないといけない。」
*
……ここまでが「コア」で、とても勉強になりました。
続く「第II部 理論」では確率について、そして「第III部 手法」では、「社会の下流化は起こっているか」などの実際の事例を使って、統計分析する手法が解説されていました。
『社会科学のための統計学入門』……質問方法も含めたデータの集め方やまとめ方など、社会科学をする上で大切な技術を学べる本でした。とても参考になったので、統計に関わる学問や仕事をしている方は、ぜひ読んでみてください。
* * *
なお社会や科学、IT関連の本は変化のスピードが速いので、購入する場合は、対象の本が最新版であることを確認してください。
<Amazon商品リンク>