統計分布を知れば世界が分かる

第1章|統計的に考えるとはどういうことか

  • 一見バラバラに見えるような量でも,それをデータとしてたくさん集めてグラフにしてみると,ある傾向や規則性,特徴が見えてくる.
    • このような作業を「統計分析」という.
    • 本章では,統計分析を行うと具体的に何がわかり,どのような意味があるかということについて考え,特に正規分布について学ぶことにする.
  • 正規分布は,平均値 \mu標準偏差 \sigma の,二つの量で特徴づけられる.
  • 正規分布はなぜ現れるのか:
    • 各個人の身長は,種々様々な多くの要因が互いにあまり関連することなくほぼ独立に,幼少のころの成長期に次々に積み重なって影響した結果として,それぞれの値に落ち着いたものと思われる.
    • いろいろなモノゴトがでたらめに積み重なる(加算される)ような過程を加算過程という.
    • ある注目する量が,この加算過程のために少し大きくなったり小さくなったりして分布する場合には,その分布は正規分布になるということが数学的に証明されている(中心極限定理).

たとえば,鉛筆を17.5cmの長さに決めて製造するとしよう.

出来上がった鉛筆の長さを1本1本測ってみると,17.5cmちょうどのものもあるが,それよりも少しだけ長いもの,短いものもあるだろう.

この誤差はどうして生まれるのであろうか.

使う物差しがほんのちょっと狂っているかもしれないし,材料を切り出すときにほんの少し長くなったり短くなったりして狂うかもしれない.

整形したり塗料を塗ったりしたときにも狂いが生じるかもしれない.

このような様々なことがそれぞれ独立に積み重なった加算過程を経て,鉛筆という製品ができることになり,その長さを調べると17.5cmを中心にした正規分布になる.

  • サイコロ投げの回数を増やすにつれて,測定された出る目の数の平均値がある一定値に近付くことを,大数の法則という.

tom0930.hatenablog.com

大数の法則は,試行回数を増やすと平均値がある一定値に近付くと主張しているが,

中心極限定理はさらに踏み込んで,平均値の周りのばらつきの分布の形が正規分布になることまで主張しているのがポイントである.

ここで最も重要なことは,多くの偶然現象が積み重なると,偶然的な影響が互いに相殺しあって一定の傾向が見えてくるようになるということである.

  • 調べたモノゴトの分布が正規分布だとわかると,今度はそのモノゴトがだいたいどれくらいの値と頻度で起こるかがわかるのである.
    • この意味で,平均値を中心にして,それからのばらつきの程度を与える標準偏差の範囲内で出来事が起こるであろうという予測が可能だということになる.


第2章|べき乗分布

  • 地震の大きさを横軸に,その大きさの地震が1年間に起こる頻度を縦軸にとると,右肩下がりになるような分布が得られる.
    • このような分布をべき乗分布といい,大まかにいって,大きくなればなるほど頻度が下がるような傾向を表す分布ということができる.
  • べき乗とはある数を何度か掛ける演算をいい,累乗ともいう.
  • べき乗分布についての最も重要なポイントは,どこが大きさの平均値なのかがわからないことである.


第3章|複雑系とランキングプロットの効用

  • 系の中でも,多種多様な物や人が多数集まって,複雑に絡みあい,関係しあいながらも,一つにまとまっているような系を特に複雑系という.


第4章|複雑な系の歴史性とその統計


第5章|現代社会に見られる対数正規分布の例


第6章|社会現象を統計的に読み解く


おわりに


関連記事

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com

tom0930.hatenablog.com