「プログラミングのための確率統計」を読む : 2章 #3

2.4 Byesの公式

  • P(X = ▲)・・・原因が▲の確率
  • P(Y = ○|X = ▲)・・・原因が▲のときに結果が○となる条件付き確率

このふたつから、

  • P(X = ▲|Y = ○)・・・結果が○だったときに原因が▲となった条件付き確率

を求める。

  • 結果が○となるすべての同時確率を足し合わせた確率の中の、原因が▲である割合が、P(X = ▲|Y = ○)となる。

例えば、

  • 100人のうち、5人が癌。
  • 癌発見システムは10回に1回は誤診する。
  • 癌発見システムがある人を「癌ではない」と判断した場合、その人が本当は癌である確率は?

f:id:stokutake:20151011111348p:plain

  • P(X = 癌) = 5/100
  • P(X = 癌でない) = 95/100

f:id:stokutake:20151011112229p:plain

  • 癌発見システムが癌でない人を、癌でないと判定する確率は、P(X = 癌でない) * 9/10 = 95/100 * 9/10
  • 癌発見システムが癌の人を、癌でないと判定する確率は、P(X = 癌でない) * 9/10 = 5/100 * 1/10
  • (5/100 * 1/10) + (95/100 * 9/10) = 0.86
  • 全体の0.86が癌でないと判定される。したの紫色の部分。

f:id:stokutake:20151011113434p:plain

この紫のうち、本当の癌の人は、赤の部分。つまり (5/100 * 1/10) / 0.86 = 0.00581

f:id:stokutake:20151011113648p:plain

  • 全体の中から、条件a(癌である)である結果x(癌でないと判定)になる確率、条件b(癌でない)である結果x(癌でないと判定)になる確率、・・・とすべて出して、足し合わせて、あらゆる条件で結果x(癌でないと判定)になる確率を出す。
  • その確率の中で、条件a(癌である)の場合の割合を出す。