統計分布を知れば世界が分かる
統計分布を知れば世界が分かる-身長・体重から格差問題まで (中公新書)
- 作者:松下 貢
- 発売日: 2019/10/16
- メディア: 新書
第1章|統計的に考えるとはどういうことか
- 一見バラバラに見えるような量でも,それをデータとしてたくさん集めてグラフにしてみると,ある傾向や規則性,特徴が見えてくる.
- このような作業を「統計分析」という.
- 本章では,統計分析を行うと具体的に何がわかり,どのような意味があるかということについて考え,特に正規分布について学ぶことにする.
- 正規分布は,平均値 と標準偏差 の,二つの量で特徴づけられる.
- 正規分布はなぜ現れるのか:
たとえば,鉛筆を17.5cmの長さに決めて製造するとしよう.
出来上がった鉛筆の長さを1本1本測ってみると,17.5cmちょうどのものもあるが,それよりも少しだけ長いもの,短いものもあるだろう.
この誤差はどうして生まれるのであろうか.
使う物差しがほんのちょっと狂っているかもしれないし,材料を切り出すときにほんの少し長くなったり短くなったりして狂うかもしれない.
整形したり塗料を塗ったりしたときにも狂いが生じるかもしれない.
このような様々なことがそれぞれ独立に積み重なった加算過程を経て,鉛筆という製品ができることになり,その長さを調べると17.5cmを中心にした正規分布になる.
- サイコロ投げの回数を増やすにつれて,測定された出る目の数の平均値がある一定値に近付くことを,大数の法則という.
大数の法則は,試行回数を増やすと平均値がある一定値に近付くと主張しているが,
中心極限定理はさらに踏み込んで,平均値の周りのばらつきの分布の形が正規分布になることまで主張しているのがポイントである.
ここで最も重要なことは,多くの偶然現象が積み重なると,偶然的な影響が互いに相殺しあって一定の傾向が見えてくるようになるということである.
- 調べたモノゴトの分布が正規分布だとわかると,今度はそのモノゴトがだいたいどれくらいの値と頻度で起こるかがわかるのである.
- この意味で,平均値を中心にして,それからのばらつきの程度を与える標準偏差の範囲内で出来事が起こるであろうという予測が可能だということになる.
第2章|べき乗分布
- 地震の大きさを横軸に,その大きさの地震が1年間に起こる頻度を縦軸にとると,右肩下がりになるような分布が得られる.
- このような分布をべき乗分布といい,大まかにいって,大きくなればなるほど頻度が下がるような傾向を表す分布ということができる.
- べき乗とはある数を何度か掛ける演算をいい,累乗ともいう.
- べき乗分布についての最も重要なポイントは,どこが大きさの平均値なのかがわからないことである.