210 likes | 408 Views
統計學. 楊志強 博士 cyang@tea.ntue.edu.tw http://tea.ntue.edu.tw/~cyang. 統計量數 Statistical Measures. 集中趨勢量數 Measures of Central Tendency. 平均數( Mean ). 母體: 樣本: 所有資料皆列入計算 易受其極端值( Extreme Value )影響 離差( Deviation )之和為零 離差平方和為最小. 中位數( Median , Me ). n 是奇數時: n 是偶數時: 不受極端值影響 。
E N D
統計學 楊志強 博士 cyang@tea.ntue.edu.tw http://tea.ntue.edu.tw/~cyang
集中趨勢量數 Measures of Central Tendency
平均數(Mean) • 母體: • 樣本: • 所有資料皆列入計算 • 易受其極端值(Extreme Value)影響 • 離差(Deviation)之和為零 • 離差平方和為最小
中位數(Median,Me) • n是奇數時: • n是偶數時: • 不受極端值影響。 • 敏感度不夠。
眾數(Mode,Mo) • 一組資料中出現最多的數值。 • 不受極端值影響。 • 不具唯一存在特性。
相對地位量數 Measures of Relative Position
百分位數(Percentile,Pk) • 將資料依大小排序並分割成100等分(即有99個等分點),每個等分點則為百分位數。 • 計算步驟: • 排序由小而大:X1,X2,X3…Xi • i有小數,無條件進一。 • i為整數,則取i與i+1的數值平均值。
四分位數(Quartile,Qk) • 第一四分位數(First/Lower-Quartile) • 第二四分位數(Second-Quartile) • 第三四分位數(Third/Upper-Quartile)
差異量數 Dispersion Measures
全距(Range) • 易於計算 • 易受最大與最小值影響 • 無法測出中間各觀察值間的差異情形
四分位差(Quartile Deviation, QD) • IQR為四分位距(Interquartile-Range) • 較不受極端值影響 • 只考慮50%的資料 • 若以中位數為一組資料集中趨勢量數,則輔以四分位差來代表其差異情形。
變異數(Variance) • 母體: • 樣本: • 變異數小,代表大部分數值集中於平均數附近,平均數代表性高;反之,平均數代表性低。 • 每個觀察值皆列入計算,敏感度高。 • 易受極端值影響。 • 若以平均數為一組資料的集中趨勢量數,則輔以變異數或標準差來代表其差異情形。
標準差(Standard Deviation) • 母體: • 樣本: • 變異數單位為平方,較難解釋;開平方根得標準差,使單位還原。 • 特性與變異數相同。
中位數、眾數與平均數間的位置關係 • 對稱(Symmetrical)分配 • 右偏(Positively Skewed, Skewed to the Right)分配 • 左偏(Negatively Skewed, Skewed to the Left)分配
盒鬚圖(Box-and-Whisker Plot) 盒狀圖(Box Plot)
以盒鬚圖檢視界外值 1.5IQR 1.5IQR 3IQR 3IQR • 1.5IQR為內圍值(Inner Fence) • 3IQR為外圍值(Outer Fence) • 觀察值落在內、外圍值之間,稱為平穩界外值(Mild outlier) • 觀察值落在外圍值之外,稱為極端界外值(Extreme outlier)
標準常態分配 • Z~N(0,1) • 以μ為中心,兩邊完美對稱。 • 平均數、中數、中位數同為0。 • 完美鐘型(bell-shaped)。
常態分配 • x~N(μ,σ2) • 分配形狀為鐘型。 • 以平均數為中心,兩邊完全對稱。 • 標準化公式: