「プログラミングのための確率統計」を読む : 2章 #3
2.4 Byesの公式
- P(X = ▲)・・・原因が▲の確率
- P(Y = ○|X = ▲)・・・原因が▲のときに結果が○となる条件付き確率
このふたつから、
- P(X = ▲|Y = ○)・・・結果が○だったときに原因が▲となった条件付き確率
を求める。
- 結果が○となるすべての同時確率を足し合わせた確率の中の、原因が▲である割合が、P(X = ▲|Y = ○)となる。
例えば、
- 100人のうち、5人が癌。
- 癌発見システムは10回に1回は誤診する。
- 癌発見システムがある人を「癌ではない」と判断した場合、その人が本当は癌である確率は?
- P(X = 癌) = 5/100
- P(X = 癌でない) = 95/100
- 癌発見システムが癌でない人を、癌でないと判定する確率は、P(X = 癌でない) * 9/10 = 95/100 * 9/10
- 癌発見システムが癌の人を、癌でないと判定する確率は、P(X = 癌でない) * 9/10 = 5/100 * 1/10
- (5/100 * 1/10) + (95/100 * 9/10) = 0.86
- 全体の0.86が癌でないと判定される。したの紫色の部分。
この紫のうち、本当の癌の人は、赤の部分。つまり (5/100 * 1/10) / 0.86 = 0.00581
- 全体の中から、条件a(癌である)である結果x(癌でないと判定)になる確率、条件b(癌でない)である結果x(癌でないと判定)になる確率、・・・とすべて出して、足し合わせて、あらゆる条件で結果x(癌でないと判定)になる確率を出す。
- その確率の中で、条件a(癌である)の場合の割合を出す。