前回までのリンク。
前回からの続きです。
内容は以下の通り。
- 正規分布とは何か
- 正規分布の標準化
- 標準化の利点
正規分布とは何か
統計学の中でも特に重要な確率分布であると言われています。
多くの分野のデータで似たような確率分布が見られます。
- 人や生物の身長
- 製品の故障率
- 株の収益率
などなど
大事な特徴として平均と標準偏差がわかれば正規分布は1つに決まります。
正規分布における確率
正規分布は図の面積で確率を見ることができます。
以下の図のような感じです。
正規分布の標準化
標準正規分布というのを見ていきましょう。
これは「平均が0で標準偏差が1の正規分布」のことを指しています。
標準偏差によって確率が変わってきて、以下のようなことがわかっています。
- 標準偏差1個分の範囲に約70%のデータが入る
- 標準偏差2個分の範囲に約95%のデータが入る
これはとても便利ですが、平均が0で標準偏差が1の正規分布なんてまあ存在しません。
なので、実際の正規分布を標準正規分布へ変換する必要があります。
式は以下の通り。
コメント
コメントを投稿