分布について : 正規分布と標準正規分布、標本から母平均の推定する(標準偏差がわかっている場合)

分布するということ

  • まちまちの値をとるということ。

正規分布

  • 平均を頂点とした釣鐘型の分布

https://upload.wikimedia.org/wikipedia/commons/thumb/7/74/Normal_Distribution_PDF.svg/720px-Normal_Distribution_PDF.svg.png

正規分布の標準化

  • 正規分布のそれぞれの値から平均値をマイナスし、標準偏差で除算。
  • (x- μ) / σ
  • この値の分布が平均0、標準偏差1の分布になる。これが、標準化された正規分布。標準正規分布
  • (x- μ)を偏差という。偏差の合計は0になるので、標準正規分布の平均は0になる。
  • σで除算することで(x- μ)が標準偏差の何倍かがわかる。つまり、その値がどのくらい月並みか特殊化がわかる。

https://upload.wikimedia.org/wikipedia/commons/thumb/8/8c/Standard_deviation_diagram.svg/400px-Standard_deviation_diagram.svg.png

  • 例えば、17歳男子の平均身長170.7 標準偏差 5.79 の場合
    • 182cmの男子の(x- μ) / σ は (182- 170.7) / 5.79 = 1.951
    • つまり、標準偏差の約1.95倍
    • 2倍近いので比較的特殊。
    • 95%の(x- μ) / σが、-1.96 ≦ (x- μ) / σ ≦ 1.96 の範囲に収まる。
    • 1.95はぎりぎり95%に収まっている

標本平均の分布

  • 正規母集団から「データをいくつか取り出して平均を算出する」ということを何度も繰り返す。
  • そうすると標本平均の分布ができる。
  • この分布も正規分布する。
  • この分布の平均、つまり、標本平均の平均は母集団の平均になる。
  • この分布の標準偏差は母集団の標準偏差σをデータの個数のルートで割ったものになる。

  • 河原のすべての石の重さが正規母集団で、標準偏差が20グラムだとする。

    • 25個の石を拾って重さを平均したら、80グラムだった。
    • 「25個の石を拾って重さを平均する」を何度も繰り返して取得した平均は正規分布する。
    • この分布の平均は母集団の平均μである。
    • この分布の標準偏差は母集団の標準偏差20をデータの個数のルート、√25で割った値、つまり、4である。
  • 母集団の平均を区間推定してみる。
  • 「25個の石を拾って重さを平均する」を何度も繰り返して取得した平均の正規分布を標準化する。  - ((「25個の石を拾って重さを平均する」を何度も繰り返して取得した平均X) - 母集団の平均μ ) / (この分布の標準偏差4) の分布が標準正規分布になる。
    • この標準正規分布もその特性上、-1.96 ≦ (X- μ) / 4 ≦ 1.96の範囲に値が収まる。Xはまちまちの値をとり、値によって、 (X- μ) / 4 が 1.96より大きくなったり小さくなったり、-1.96より大きくなったり小さくなったりする。
    • 実際に観測された標本平均80を代入すると、-1.96 ≦ (80- μ) / 4 ≦ 1.96。この式が成り立たないμは、現実の母集団の平均値として不適切であると考える。
    • 72.16 ≦ μ ≦ 87.84
    • μは95%の確率で72.16以上、87.84以下