【統計学再入門⑫】未知な世界を切り開く推定

前回までのリンク。


内容は以下の通り。

  1. 推定について
  2. t分布
  3. カイ2乗分布
  4. チェビシェフの不等式

推定について

推定とは実際には知り得ないものを、統計の理論を使って推計することです。
母集団を知りたいけど、全てのデータは取れないしなんとか知る方法はないか?
というので、前回は標本を取ることで母集団を推定できることを見ていきました。


推定の中でも区間推定についてみていきましょう。


区間推定

母集団の例えば平均値の推定を信頼度に対応した範囲で表すことを区間推定と言います。
逆に単一数値で表すのを点推定と呼ぶ。

実際の問題で考えてみましょう。

ボールベアリングの製造をしている企業で、正常な場合は平均が5mmで標準偏差が1mmであることがわかっている。過去3日間でとったサンプルの平均(サイズは100)がそれぞれ、5.1mm、4.9mm、5.3mmであったとすると信頼度95%以内に入るか?

まずは標準化を行います。
中心極限定理より標本平均の標準偏差は
σX=1 / √100 = 0.1

次に95%信頼区間のZ値を出します。
正規分布の標準化のところででできたものです。
片側が0.475の値なのでZ値は1.96です。

したがって母集団の95%信頼区間は
5 + (0.1 * 1.96) = 5.196
5 - (0.1 * 1.96) = 4.804
の間となります。

母集団の値は本当はわからないので、実際は標本平均の95%信頼区間の間に母集団の平均があるはずという推定を行うわけですね。(つまり標本平均を100とった場合に五回は標本平均の信頼区間に真の平均が入らない)

図で見てみましょう。

では問題に戻って計算していきましょう!

5.1mmの場合
5.1 + (0.1 * 1.96) = 5.296
5.1 - (0.1 * 1.96) = 4.904
信頼区間に母集団の真の平均が入っている。

4.9mmの場合
4.9 + (0.1 * 1.96) = 5.096
4.9 - (0.1 * 1.96) = 4.704
信頼区間に母集団の真の平均が入っている。

5.3mmの場合
5.3 + (0.1 * 1.96) = 5.496
5.3 - (0.1 * 1.96) = 5.104
信頼区間に母集団の真の平均が入っていない。
故に正常ではない。

何となくイメージできたでしょうか。
そして推定は前提の違いにより推定の方法が変わってきます。
それを図示化したのが以下。

平均の推定では標準偏差がわかっているか、分布は正規分布か、標本サイズによって推定の方法が変わります。
標準偏差の推定はカイ2乗分布というのを用います。

次回からそれぞれ見ていきましょう!

コメント