Tom.notes();

Computer Scienceや読書のメモ

統計思考入門 ― プロの分析スキルで「ひらめき」をつかむ

 

統計思考入門 ― プロの分析スキルで「ひらめき」をつかむ

統計思考入門 ― プロの分析スキルで「ひらめき」をつかむ

 

 

 

第1章 数字で考えることのおもしろさ

  • 数字で置き換えることで,なんとなく理解していたことが明確になる.
  • 数字は,周囲や組織を動かすための最上のツール.

 

第2章 「同じもの」のなかに違いを見つけ出す

  • 主成分分析は,「分散が最大になる位置」まで軸を回転させる.軸を回転させて視界をずらす(最も視界がひらけた位置に立つ)ことでこれまで見えなかったものが見えるようになる.
  • 固有値はデータの分散(ばらつき)の大きさを表し,寄与率は情報の集約度を表す.
  • つまり,主成分分析の固有値は,変数から取り出された情報量の大きさを示している.

 

第3章 「違うもの」のなかに同じところを見つける

  • クラスター分析は,似たもの同士をグルーピングしていく.
  • どの情報,どんなデータで個体間の特徴付けを行うのか,が分析において最も大切.
  • 違いを見極めるために似たもの同士を探る.

 

第4章 「全体」から「小さい全体」をつくる 

  • 「誰(標本・サンプル)」に「みんな(母集団)」を代表させるか.
  • 母集団(全体)が大きくなるほど,全部を調べることは困難なので,母集団を小さく分けたい.
  • 「標本の代表性が不安定」にならないように注意.
  • 結果に影響を及ぼさない誤差は無視してもかまわない.

 

第5章 「事実」は「真実」と一致するか

  • 標本は本当に全体を代表しているのだろうか.
  • 統計という手法は,全体を構成する個が数えきれないほど多いとき,「全体から一部分を取り出して,できるだけ正確に全体を推定したい」という思いから磨かれてきた技術と言える.
  • 「めったに起こらない・起こる」の境界値を有意水準と呼び,これを超えた場合は,前提とした仮設は棄却される.
  • 帰無仮説は,「そんなはずはない」という無に帰したいと思う仮説を不本意ながら設定し,これを棄却することで,本当に証明したかったことを立証する手法.
  • できることの範囲内で真実に迫ろうとする現実主義的なしぶとさ.

 

第6章 「迷い」から抜け出すための手法

  • 手を引くべきか,続けるべきか.
  • 線形判別分析は,2つのグループを分ける最適な1次関数のモデルをつくること.
  • 関係づけを行うための変数を見つける.
  • 説明変数を複数用いた回帰分析を重回帰分析という.

 

第7章 数字に現れた現実にいかに対処するか

  • 統計分析の基本は,たくさんのものを「同じ傾向をもつグループ」や「異なる傾向をもつグループ」に分類すること.
  • 分析するというのは,たくさんの個体の特徴を一つひとつ調べ,それらの関係性を見つけ出し,その強弱やつながり方によって個体をもっともよく分類すること.
  • うまく分けることが,必ずしも分析の目的ではない.
  • 実務レベルで最大の成果を上げるためには,得られた結果(現実)と向き合わなければならない.
  • 完璧な分類を目指すのではなく,不明確な現実をそのまま受け入れつつ,そこから次に何をすべきか,を考えることが大切.

 

第9章 統計的アプローチで発想するということ

  • 数字が並んだら,まず合計を計算して平均値を算出する癖をつける.
  • 変数に対して,「平均」「分散」「標準偏差」を算出する.(分散は,偏差の二乗の平均値.標準偏差は,分散の平方根.)
  • 得られた結果の解釈の是非にこだわるのではなく,「どの正解」を採用し,次にどう行動するのか,が大切.
  • 自分自身で感じ,正しく考え,物事を時間の経過と社会との関連性のなかにとらえ,判断し,行動すること.