【統計学再入門⑪】母数推定の基礎「中心極限定理」

前回までのリンク。

,


統計学は

全ての統計学の分析対象となる現象はその全体を観察する代わりに一部分を観察して、現象全体の特性を推測し分析する

という話を前にしましたね。

その推定の基礎となる話をしていきましょう。

内容は以下の通り。
  1. 統計的有意性とは
  2. 標本平均の分布
  3. 中心極限定理とは

統計的有意性とは

まず聞いたことがあるかなと思いますが、統計学では有意であるか有意でないかというのがよく出てきます。
簡単にいうと

「有意である」

滅多に起きないこと

「有意でない」

たくさん起きること


イメージ的に表すと

後々どういう意味を持つのかわかってきますので、今はこれくらいの理解で。

標本平均の分布

標本平均とは母集団から抽出した標本の平均値のことです。
標本1、標本2のように複数の標本のそれぞれの平均値の分布について。
標本平均の性質についてみていきましょう。
  • 標本平均の分布は正規分布となる(標本サイズが30以上)
  • 標本平均の平均は母集団の平均と等しくなる

この性質を利用すると母平均の推定が行えるようになります。
  • 母集団が正規分布であろうとなかろうとサンプルサイズ30以上標本平均は正規分布をする
  • 母集団が正規分布の場合は30以下でも正規分布となる



この標本のサイズによって標本平均の分布が変わってきます。
サンプルサイズ1→元の分布と一緒の形となる。
大きくなるにつれ平均値へ収束していく。
標本のサイズが大きいほど、1つ1つの標本は平均に近くなる。
母集団と同じサイズの標本サイズを分布にすると一本の線となる。



この標本平均が中心極限定理につながってきます。


中心極限定理とは

ズバリ
  • どのような分布であろうと、その標本平均は標本サイズが大きくなるにつれて以下のようになる

この法則のおかげで正規分布以外の分布であろうと分析できるようになる!
ここから推定という統計らしいことができてくるわけですね。

例で考えてみましょう。
1〜6までのサイコロを考えてみてください。
これは1回の試行では全ての目が同じ確率になる一様分布です。


ですがこれの標本平均を取って分布にすると正規分布に近づくのです。
例えば十回振ると、その平均値は母集団の平均値である3.5らへんに近い数値になるはずです。
(1+2+3+4+5+6) / 6 = 3.5

これで一様分布であったサイコロの目の分布も、標本平均を取ることで正規分布にすることができます。

次回は実際に推定についてみていきましょう!


コメント