「プログラミングのための確率統計」を読む : 2章 #2
2.2 同時確率と周辺確率
確率変数 X , Yがある場合、 - X=a、Y=bになる確率をP(X=a,Y=b)とする。同時にX=a、Y=bが成り立つ確率 = 同時確率。その分布を同時分布 - P(X=a)、P(Y=b)になる確率は周辺確率。その分布を周辺分布
- サイコロXとYをふたつ投げて、X6の場合つまり、P(X = 6)の場合は、
- P(X = 6,Y = 1) + P(X = 6,Y = 2) + P(X = 6,Y = 3) + P(X = 6,Y = 4) + P(X = 6,Y = 5)+ P(X = 6,Y = 6) = P(X = 6)
- つまり、同時確率を足し合わせると、周辺確率が求まる。逆は無理。
確率変数が3つ以上の場合も同じ
2.3 条件付き確率
2.3.1 条件付き確率とは
神様視点的には領域限定
♦️J ♦️Q ♦️K ♥J ♥Q ♥K ♥1 ♥2 ♠️K ♠️1 ♠️2 ♥3 ♠️3 ♠️4 ♠️5 ♠️6
- 赤い札は9枚
- 黒い札は7枚
- 数字は9枚
- 絵札は7枚
- 赤くて数字は3枚
- 赤くて絵札は6枚
- 黒くて数字は6枚
- 黒くて絵札は1枚
赤い札に限定すると、
- 赤い札の世界は、 9/16 の世界
- この世界の絵札の割合が、「赤いという条件のもとでの絵札の確率」条件付き確率
- (6/16) / (9/16) = 6/9 = 2/3
A県における工場の面積の割合は、A県の工場の面積をA県の面積でわればいい。
P(Y = b| X = a) = P(X = a, Y = b)/ P(X = a)
2.3.1 同時分布・周辺分布・条件付き分布の関係
ジョーカーを除いた52枚のトランプから1枚引き、さらにもう一枚引く。 両方同じ色の確率は?
- 両方赤の場合。
- 1枚目が赤の確率は、26/52 = 1/2
- 1枚目が赤でかつ2枚目も赤の確率は、1/2 * 25/51
- 黒の場合も同じなので、(1/2 * 25/51) * 2 = 25/51
- 25/51は実はP( Y= 赤| X = 赤) = 25/51
- 1枚目が赤ということは、赤は残り25枚、全部で残り、51枚だから。
2.3.4 3つ以上の確率変数
2つの時と同じ、例えば、
P(X = a, Y = b, Z =c) を考える。
- P(X = a)とP(Y = b)とP(Z = c)の同時確率。
- P(図柄 = 絵札, タイプ =♦️,色 = 赤) = P(図柄 = 絵札|タイプ =♦️,色 = 赤) * P(タイプ =♦️,色 = 赤)
- P(図柄 = 絵札|タイプ =♦️,色 = 赤) = 赤で♦️という世界に限定した上で、図柄が絵札ということ。(3/52) / (1/4)
- P(タイプ =♦️,色 = 赤) = P(タイプ =♦️|色 = 赤) * P(色 = 赤)
- P(タイプ =♦️|色 = 赤) = 赤いという世界に限定した上で、♦️であるということ (1/4) / (1/2)
- P(色 = 赤) = 1/2
- P(図柄 = 絵札, タイプ =♦️,色 = 赤) = (3/52) / (1/4) * (1/4) / (1/2) * 1/2 = 3/52
P(◯◯ , ×× | △△) = P(◯◯ , ×× , △△) / P(△△) P(◯◯ , ×× , △△) = P(◯◯ | ×× , △△) P( ×× | △△) P(△△) P(◯◯ , ×× | △△) = P(◯◯ | ×× , △△) P( ×× | △△)