【統計学再入門⑬】少ないサンプルで用いる「t分布」

 前回までのリンク。


t分布について

母集団が正規分布で小さい標本しか取れない場合に用いるものです。
以下のような特徴を持っています。
  • 自由度が変わると分布の形が変化する(標準正規分布は自由度で変化しない)
  • 自由度が低いと裾が広くなる=不確実性が大きい


t分布の性質

t分布は標本サイズが30を超えるとほぼ正規分布と同じになることがわかっています。
これは中心極限定理で話したことと一緒です。

統計量と式


標準正規分布のzを計算する式に似ています。
違いは母集団の標準偏差か標本標準偏差かの違いです。
標本標準偏差を使って標準正規分布に当てはめると、標本数が少ない場合にズレが生じます。
このズレをなくし正確な分布を作ろうとしてできたのがt分布です。

t分布を用いた推定

例題で考えてみましょう。

ある工場で製造される商品の重量を調べたいと考え、ランダムに抽出した10個の商品の重量を測定したところ、以下のようなデータが得られました(単位:g):
100.2,99.8,101.0,100.5,100.1,99.9,100.3,100.0,100.4,99.7
このデータをもとに、母平均の95%信頼区間を求めます。母分散は未知とします。

サンプル平均は100.19
標準偏差は0.463

t分布表から臨界値は2.262

以下の式に代入。

結果は
[99.86,100.52]
となる。

やっていることは正規分布とほぼ一緒でt分布表というのを用いて信頼区間を推定していますね。

コメント