220 likes | 536 Views
十一、皮爾森積差相關與簡單直線迴歸. 11. Pearson’s Correlation & Simple Linear Regression. 相關係數的計算與假設. 相關分析是分析變數間關係的方向與程度大小的統計方法 相關係數的公式. 相關係數的特性. 其絕對值在 0-1 之間 正負號僅表示其相關的方向,與相關程度無關 絕對值愈大相關程度愈高. 相關係數的檢定. 虛無假設 H 0 : ρ = 0 t 檢定統計量. 相關係數的檢定. 虛無假設 H 0 : ρ = ρ 0 H 1 : ρ 0 不為 0 建議採用 Fisher 轉換
E N D
十一、皮爾森積差相關與簡單直線迴歸 11. Pearson’s Correlation &Simple Linear Regression
相關係數的計算與假設 • 相關分析是分析變數間關係的方向與程度大小的統計方法 • 相關係數的公式
相關係數的特性 • 其絕對值在0-1之間 • 正負號僅表示其相關的方向,與相關程度無關 • 絕對值愈大相關程度愈高
相關係數的檢定 • 虛無假設 H0: ρ = 0 • t檢定統計量
相關係數的檢定 • 虛無假設 H0: ρ = ρ0 H1: ρ0不為0 • 建議採用Fisher轉換 • Zr =0.5Ln((1+r)/(1-r)) Zr~N(Zρ, 1/n-3)
簡單線性迴歸分析 • 簡單線性迴歸是討論一個自變數與一個依變數間關係的統計方法 • 簡單線性迴歸模型 • Yi=+Xi + i • 假設條件 • Y為依變數,是需要被預測(或)解釋的變數 。 • X為自變數,是用來預測的變數,沒有誤差。 • 、為未知常數。 • ~N(0, 2)。 • Cov(i, j)=0;i≠j。 • Cov(i, X)=0
Linear Normal Normal Homoscedasticity
估計方法-最小平方法 • 使樣本觀察值與估計值的差異之平方和為最小的估計方法 • 估計迴歸方程式
估計方法-最小平方法 • 其中 • 使用最小平方法時,樣本數要大於參數的個數,且自變數的觀察值至少要有一個不同(這是數學上的要求,實作上樣本數需要更多)
迴歸係數的檢定 • 迴歸係數的SE如下:and • 由於 σy|x通常是未知的,因此常以 sy|x來估計 σy|x • 所以 and
迴歸係數的檢定 • 對於H0: β = β0 vs. H1: β ≠ β0, 我們採用 • 自由度為n-2
迴歸係數的檢定 • 對於 H0: α = α0 vs. H1: α ≠ α0, 我們採用 • 自由度為 n-2 • 不過極少有對截距進行檢定的時候
判定係數 • R^2=可解釋的變異/總變異=SSR/SST • R^2愈大,表示迴歸式的解釋力愈高,模式的適配度愈好。
相關≠因果 -- 人從哪裏來? • 歐美的傳說:鸛鳥送子 • 1980-1990間17個歐洲國家的鸛鳥與嬰兒出生數 相關係數 r = 0.62 p = 0.008 Matthews, R. (2000). Storks Deliver Babies (p = 0.008). Teaching Statistics, 22(2) P.36 – 38.