「プログラミングのための確率統計」を読む : 1章

プログラミングのための確率統計

プログラミングのための確率統計

第1章 確率とは

1.1 数学の立場

この章の目的は、「確率」のぼんやりとしたイメージと、その抽象的な定義を結びつけることにある。

1.2 三つの扉(モンティホール問題) - 飛行機視点

1.2.1 モンティホール問題
  • 3つの扉がある
  • そのうちひとつは開けると高級車がある
  • 残りふたつは開けるとやぎ
  • 挑戦者はひとつの扉を選ぶ
  • 司会者は選ばれなかったふたつのうち、不正解の扉を開き、挑戦者に「選び直してもいいですよ」
  • 挑戦者は選び直したほうがいいのか?そのままでいいのか?どちらでも同じか

モンティ・ホール問題 - Wikipedia

1.2.2 正しい答えとよくある勘違い

正しい答えは、選び直すほうが得。 しかし、 選び直しても、正解の確率は1/2になるだけなので、得にはならない、と思える。

1.2.3 飛行機視点への翻訳
  • 360の会場でモンティホール問題を出題。Aが正解の会場=120会場,Bが正解の会場=120会場,Cが正解の会場=120会場
  • 120会場のうち、挑戦者がAを選ぶ=40会場、挑戦者がBを選ぶ=40会場、挑戦者がCを選ぶ=40会場

f:id:stokutake:20150905112437p:plain

正解がBの場合も、正解がCの場合も同様に、

  • 選び直した場合は、80会場で車ゲット。
  • 選び直さなかった場合は、40会場で車ゲット。

合計すると、

  • 選び直した場合は、240会場で車ゲット。240/360=2/3で車ゲット。
  • 選び直さなかった場合は、120会場で車ゲット。120/360=1/3で車ゲット。

なので、選び直したほうがお得。

1.3 三つ組(Ω、F、P) ー 神様視点

神様から見れば、

  • さまざまな世界がある。
  • しかし、それぞれの世界にはシナリオが配られており、起きることが決まっている。すべて確定的。
  • ex ) すでに結果が決まっているモンティホールゲームをする会場が360ある = 360の世界がある。
  • 確率的なことはなにもない。

しかし、人間からみると、

  • 自分がどの世界に住んでるのかわからない。
  • 360の会場のうち、どの会場を観覧しているのかわからない。だから、ゲームの結果もわからない。
  • 不確実さがある。

会場の数=世界の数を数えることができたら、不確実さを論じることができる。 しかし、人間にはできない。

そこで、人間は面積をはかる。

  • Ω = パラレルワールド全体 = 面積1
  • P(x) = 面積をはかる関数
  • ω = パラレルワールドの中の世界のひとつ。1以下の面積を占める。すべてのωの面積を足すと1になる。
  • ω' = コインを投げて表が出る世界 = 面積0.5 = P (ω)
  • ω'' = コインを投げて裏が出る世界 = 面積0.5 = P (ω')

パラレルワールド全体の集合ΩとΩ内の面積を計測する関数Pがあれば、確率の話ができる。

1.4 確率変数

確率的な量を確率変数という。運次第で揺らぐ不確定な量。

神様視点で言えば、確率変数とは、ただの関数 f(ω) 。神様はパラメータωがどのパラレルワールドかわかっているから。 人間視点でいうと、f(ω)は不確定。ωがわからないから。

  • X(u,v)は、uとvの値に応じて、あたりかはずれになる。
  • 0 < u < 1 かつ 0 < v < 1
  • この場合は、あたり、はずれ、が確率変数

実数値の確率変数なら、例えば、

  • Z(u,v) = 20(u - v)
  • 0 < u < 1 かつ 0 < v < 1 なら 取りうる値は -20から20までの間
  • 0 < Z(u,v) < 10 となる確率は?
    • 20(u - v)が0になるのは(u=0,v=0) (u=1,v=1)
    • 20(u - v)が10になるのは(u=0.5,v=0) (u=1,v=0.5)
    • (u=0,v=0) (u=1,v=1) (u=0.5,v=0) (u=1,v=0.5) の4つの点に囲まれた部分の面積が答え。

1.5 確率分布

  • 確率変数はある世界ωをパラメータにした場合のf(ω) 。どの世界でどんな値がでるかを特定。
  • 確率分布はωを意識しない。出る値とその面積 = 確率を意識する。

サイコロの目

サイコロの目 その目がでる確率
1 0.4
2 0.1
3 0.1
4 0,1
5 0.1
6 0.2

ざっくり言えばどの確率=面積でどの値がでるかの一覧表。

確率変数が与えられたら確率分布が作れる。 上の例であれば、1,2,3,4,5,6という確率変数とそのf(ω)である0.4,0.1,0.1,0.1,0.1,0.2が決まっていれば、確率分布は作れる。 しかし、f(ω)である0.4,0.1,0.1,0.1,0.1,0.2だけでは、確率変数はわからない。

1.6 現場流の略記法

1.7 Ωは裏方

Ωは円でもいいし立体でもいい。

念押し

  • 確率は面積だからマイナスにならない。
  • 全体の面積は1を越えない。
  • ⚪️⚪️な確率と⚪️⚪️でない確率を足せば、1