2015-10-01から1ヶ月間の記事一覧

回帰分析について

以下のデータの公転周期=orbital-periodを応答変数、説明変数をsemi-major-axisにして分析する。 planet,inclination,eccentricity,semi-major-axis,orbital-period Mercury,7.004,0.2056,0.3871,0.241 Venus,3.39471,0.0068,0.72333,0.615 Earth,0.00005,0.…

「プログラミングのための確率統計」を読む : 3章 #1

離散値の確率分布 確率論の基本 運次第で揺らぐ値の、 平均的にはどんな値がでるのかが期待値 値のばらつき具合が分散 大数の法則は、「揺らぐ値でもたくさん集めて平均すればゆらがなくなる」という性質 2項分布 「確率pで表が出るようなコインをn回投げた…

「プログラミングのための確率統計」を読む : 2章 #4

2.5 独立性 「独立性」とは、「XとYの間に全く関わりがない」ということ。 P(▲▲|○○) = P(▲▲|○○でない)ということ。 事象の独立性も確率変数の独立性も同じように言い換えられる P(▲▲|○○) = P(▲▲|○○でない) P(▲▲|○○) = P(▲▲) P(▲▲,○○) : P(▲▲,○○でない) = P(▲…

「プログラミングのための確率統計」を読む : 2章 #3

2.4 Byesの公式 P(X = ▲)・・・原因が▲の確率 P(Y = ○|X = ▲)・・・原因が▲のときに結果が○となる条件付き確率 このふたつから、 P(X = ▲|Y = ○)・・・結果が○だったときに原因が▲となった条件付き確率 を求める。 結果が○となるすべての同時確率を足し合わ…

pandasとmatplotlibでcsvデータを分析する

分析対象のデータは、日本統計学会公式認定 統計検定2級対応 統計学基礎の練習問題を一部加工。 day,Temperature,humidity,sunlighth,Wind 1,6.6,33.0,7.9,NorthWest 2,7.0,41.0,8.4,NorthNorthWest 3,5.9,48.0,5.2,NorthNorthWest 4,6.3,40.0,8.4,NorthWes…

分布について : t分布

t分布 正規母集団から「データをn個、((取り出した値n個の平均 - 母平均) / 取り出した値n個の標準偏差) * (n - 1) を計算する」ということを何度も繰り返す。 この値n-1の自由度で t分布する。 t分布の数表は明らかなので、母集団の平均を推定できる。 正規…