機率與統計

1.2 Basic plots 基本圖形

標準化公式

\(z_i = \frac{x_i-\mu}{\sigma}\)

統計

缺失值

重點

常用函數

標準化公式

\(z_i = \frac{x_i-\mu}{\sigma}\)

統計

缺失值

重點

常用函數

1.4 Higher-order statistics

統計量

2.1 Basic Descriptive Statistics 敘述統計

根據median為中心看。

情況

盒鬚圖

盒子上面有Q1(HL), median, Q3(HU),中間的線上為median,而下面線為min(也可能是1.5倍的距離),上面線的位置在1.5*(HU - HL),大於此數值的點(在圖上方),為離異點(potential outliers)。

注意

如果上下範圍夠大,都有大於1.5 * (HU - HL)數據的話,上下可能都會有離異點。

3.2 Probability Space

實驗->樣本空間 \(\Omega= \{ A \}\)

機率空間 \(S = \{S_i\}\)

樣本事件"sample event",\(A_i=\{T,H,T\} \rightarrow P_i /8 \)

\(P_i >= 0, \Sigma P_i = 1\) 每個\(A_i\)給機率值\(P_i\)給\(S_i=(A_i, P_i)\)

實驗的outcome(產出結果)

機率子空間

\(S_2 = \{S: X_1 + X_3 >= 3\}\)

機率為measure (量度,量度恆正),


R Big Data Probability And Statistic