「プログラミングのための確率統計」を読む : 2章 #2

2.2 同時確率と周辺確率

確率変数 X , Yがある場合、 - X=a、Y=bになる確率をP(X=a,Y=b)とする。同時にX=a、Y=bが成り立つ確率 = 同時確率。その分布を同時分布 - P(X=a)、P(Y=b)になる確率は周辺確率。その分布を周辺分布

  • サイコロXとYをふたつ投げて、X6の場合つまり、P(X = 6)の場合は、
  • P(X = 6,Y = 1) + P(X = 6,Y = 2) + P(X = 6,Y = 3) + P(X = 6,Y = 4) + P(X = 6,Y = 5)+ P(X = 6,Y = 6) = P(X = 6)
  • つまり、同時確率を足し合わせると、周辺確率が求まる。逆は無理。

確率変数が3つ以上の場合も同じ

2.3 条件付き確率

2.3.1 条件付き確率とは

神様視点的には領域限定

♦️J ♦️Q ♦️K ♥J ♥Q ♥K ♥1 ♥2 ♠️K ♠️1 ♠️2 ♥3 ♠️3 ♠️4 ♠️5 ♠️6

  • 赤い札は9枚
  • 黒い札は7枚
  • 数字は9枚
  • 絵札は7枚
  • 赤くて数字は3枚
  • 赤くて絵札は6枚
  • 黒くて数字は6枚
  • 黒くて絵札は1枚

赤い札に限定すると、

  • 赤い札の世界は、 9/16 の世界
  • この世界の絵札の割合が、「赤いという条件のもとでの絵札の確率」条件付き確率
  • (6/16) / (9/16) = 6/9 = 2/3

A県における工場の面積の割合は、A県の工場の面積をA県の面積でわればいい。

P(Y = b| X = a) = P(X = a, Y = b)/ P(X = a)

2.3.1 同時分布・周辺分布・条件付き分布の関係

ジョーカーを除いた52枚のトランプから1枚引き、さらにもう一枚引く。 両方同じ色の確率は?

  • 両方赤の場合。
    • 1枚目が赤の確率は、26/52 = 1/2
    • 1枚目が赤でかつ2枚目も赤の確率は、1/2 * 25/51
  • 黒の場合も同じなので、(1/2 * 25/51) * 2 = 25/51
    • 25/51は実はP( Y= 赤| X = 赤) = 25/51
    • 1枚目が赤ということは、赤は残り25枚、全部で残り、51枚だから。

2.3.4 3つ以上の確率変数

2つの時と同じ、例えば、

P(X = a, Y = b, Z =c) を考える。

  • P(X = a)とP(Y = b)とP(Z = c)の同時確率。
  • P(図柄 = 絵札, タイプ =♦️,色 = 赤) = P(図柄 = 絵札|タイプ =♦️,色 = 赤) * P(タイプ =♦️,色 = 赤)
  • P(図柄 = 絵札|タイプ =♦️,色 = 赤) = 赤で♦️という世界に限定した上で、図柄が絵札ということ。(3/52) / (1/4)
  • P(タイプ =♦️,色 = 赤) = P(タイプ =♦️|色 = 赤) * P(色 = 赤)
  • P(タイプ =♦️|色 = 赤) = 赤いという世界に限定した上で、♦️であるということ (1/4) / (1/2)
  • P(色 = 赤) = 1/2
  • P(図柄 = 絵札, タイプ =♦️,色 = 赤) = (3/52) / (1/4) * (1/4) / (1/2) * 1/2 = 3/52

P(◯◯ , ×× | △△) = P(◯◯ , ×× , △△) / P(△△) P(◯◯ , ×× , △△) = P(◯◯ | ×× , △△) P( ×× | △△) P(△△) P(◯◯ , ×× | △△) = P(◯◯ | ×× , △△) P( ×× | △△)