【統計学再入門⑨】代表的な連続的確率分布「正規分布」

前回までのリンク。

,


前回からの続きです。

内容は以下の通り。

  1. 正規分布とは何か
  2. 正規分布の標準化
  3. 標準化の利点

正規分布とは何か

統計学の中でも特に重要な確率分布であると言われています。
多くの分野のデータで似たような確率分布が見られます。

  • 人や生物の身長
  • 製品の故障率
  • 株の収益率
などなど

大事な特徴として平均と標準偏差がわかれば正規分布は1つに決まります。


正規分布における確率

正規分布は図の面積で確率を見ることができます。
以下の図のような感じです。


正規分布の標準化

標準正規分布というのを見ていきましょう。
これは「平均が0で標準偏差が1の正規分布」のことを指しています。

標準偏差によって確率が変わってきて、以下のようなことがわかっています。
  • 標準偏差1個分の範囲に約70%のデータが入る
  • 標準偏差2個分の範囲に約95%のデータが入る



これはとても便利ですが、平均が0で標準偏差が1の正規分布なんてまあ存在しません。
なので、実際の正規分布を標準正規分布へ変換する必要があります。
式は以下の通り。


ちなみに通常の正規分布でも標準偏差によってデータが入る割合は変わりません。



標準化の利点は次回。

コメント