サンプリングって何だろう|統計を使って全体を知る方法

まえがき

  • データを適切に収集・分析することの重要性は,多くの情報にあふれる現代だからこそ以前にも増して大きくなっている.
  • データはいったいどのように収集するべきか?この問題に解決の指針を与えるのが本書の主題である「サンプリング」である.

第1章 サンプリングの有用性

  • サンプリングとは,知りたい全部の対象から一部だけを抽出することであり,その抽出法の総称を「サンプリング法」という.
  • 統計学の世界では,興味の対象である集団全体を「母集団」といい,そこからサンプリングされる要素の集まりを「標本」または「サンプル」という.
  • 母集団から無作為にサンプルを抽出することを,「無作為抽出」という.
  • サンプリングを何回も繰り返すことによって,サンプリングの推定精度をだいたい確かめることができる.
  • サンプルサイズが大きいほど,得られた推定値の散らばりが小さく,推定精度が高い.
  • サンプリングで得られた推定値の分布が平均◯,分散◯の正規分布とみなすことができれば,「95%の推定誤差の範囲」や「特定の推定誤差の大きさに対する確率」などが比較的簡単に計算できるようになる.
  • 「無作為化」は,大数の法則中心極限定理を成立させるための条件であるため,無作為化が妥当でない場合,サンプリングを用いた推測はもはや科学的な有効性を保つことはできない.

第2章 世の中の動向を捉える

  • サンプリングとは簡単にいうと,数が多すぎたり,規模が大きすぎたりして全容の把握が難しい対象の特徴を,全体から抜き取った一部を調べることによって明らかにする方法.
  • 社会調査の目的とは"データという木"を個別に見ることではなく,それらで構成された"社会という森"を見ることにある.
  • 母集団の未知なる特徴を解明することが,社会調査における普遍的な目的.
  • 母集団から一定数「サンプリング」してきて,調査した結果をもとに母集団の状態を推測する.
  • 「サンプル数」とは,"サンプル自体の数"を指す.
  • 「サンプルサイズ」とは,ひとつのサンプルの中に"サンプルを構成する要素が何個あるか"を表す.
  • 1000人が,300個ずつサンプリングする場合,「サンプル数は1000」,「サンプルサイズは300」となる.
  • 無作為抽出法は,数学的・統計学的根拠のある,とても科学的な方法.
  • 対象を何段階か(たいていは2〜3段階)に分けてサンプリングしていく方法を多段抽出法という.
  • 層化抽出法の「層」では,サンプリング対象の特性を考慮した分類がなされているため,作り出されたグループ(層)は,何らかの意味や固有の性質を有している.
  • 層化抽出法と多段抽出法を一緒に用いることで双方の弱点を補い合い,精度と効率性を両立させているのが「層化多段抽出法」という技法. f:id:tom0930:20181122203852j:plain

第3章 生物を数える

  • 母集団からの無作為抽出は,あらゆるサンプリングにおいて必要な大前提であるといえる.

文献案内

統計学入門 (基礎統計学Ⅰ)

統計学入門 (基礎統計学Ⅰ)

  • 発売日: 1991/07/09
  • メディア: 単行本

関連記事

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com