統計思考入門 ― プロの分析スキルで「ひらめき」をつかむ
第1章 数字で考えることのおもしろさ
- 数字で置き換えることで,なんとなく理解していたことが明確になる.
- 数字は,周囲や組織を動かすための最上のツール.
第2章 「同じもの」のなかに違いを見つけ出す
- 主成分分析は,「分散が最大になる位置」まで軸を回転させる.軸を回転させて視界をずらす(最も視界がひらけた位置に立つ)ことでこれまで見えなかったものが見えるようになる.
- 固有値はデータの分散(ばらつき)の大きさを表し,寄与率は情報の集約度を表す.
- つまり,主成分分析の固有値は,変数から取り出された情報量の大きさを示している.
第3章 「違うもの」のなかに同じところを見つける
- クラスター分析は,似たもの同士をグルーピングしていく.
- どの情報,どんなデータで個体間の特徴付けを行うのか,が分析において最も大切.
- 違いを見極めるために似たもの同士を探る.
第4章 「全体」から「小さい全体」をつくる
- 「誰(標本・サンプル)」に「みんな(母集団)」を代表させるか.
- 母集団(全体)が大きくなるほど,全部を調べることは困難なので,母集団を小さく分けたい.
- 「標本の代表性が不安定」にならないように注意.
- 結果に影響を及ぼさない誤差は無視してもかまわない.
第5章 「事実」は「真実」と一致するか
- 標本は本当に全体を代表しているのだろうか.
- 統計という手法は,全体を構成する個が数えきれないほど多いとき,「全体から一部分を取り出して,できるだけ正確に全体を推定したい」という思いから磨かれてきた技術と言える.
- 「めったに起こらない・起こる」の境界値を有意水準と呼び,これを超えた場合は,前提とした仮設は棄却される.
- 帰無仮説は,「そんなはずはない」という無に帰したいと思う仮説を不本意ながら設定し,これを棄却することで,本当に証明したかったことを立証する手法.
- できることの範囲内で真実に迫ろうとする現実主義的なしぶとさ.
第6章 「迷い」から抜け出すための手法
- 手を引くべきか,続けるべきか.
- 線形判別分析は,2つのグループを分ける最適な1次関数のモデルをつくること.
- 関係づけを行うための変数を見つける.
- 説明変数を複数用いた回帰分析を重回帰分析という.
第7章 数字に現れた現実にいかに対処するか
- 統計分析の基本は,たくさんのものを「同じ傾向をもつグループ」や「異なる傾向をもつグループ」に分類すること.
- 分析するというのは,たくさんの個体の特徴を一つひとつ調べ,それらの関係性を見つけ出し,その強弱やつながり方によって個体をもっともよく分類すること.
- うまく分けることが,必ずしも分析の目的ではない.
- 実務レベルで最大の成果を上げるためには,得られた結果(現実)と向き合わなければならない.
- 完璧な分類を目指すのではなく,不明確な現実をそのまま受け入れつつ,そこから次に何をすべきか,を考えることが大切.
第9章 統計的アプローチで発想するということ
- 数字が並んだら,まず合計を計算して平均値を算出する癖をつける.
- 変数に対して,「平均」「分散」「標準偏差」を算出する.(分散は,偏差の二乗の平均値.標準偏差は,分散の平方根.)
- 得られた結果の解釈の是非にこだわるのではなく,「どの正解」を採用し,次にどう行動するのか,が大切.
- 自分自身で感じ,正しく考え,物事を時間の経過と社会との関連性のなかにとらえ,判断し,行動すること.