410 likes | 777 Views
社會統計. 第十講 相關與共變. Covariance, 共變量. 觀念. 當 X, Y 兩隨機變數不互為獨立時,表示兩者間有關連。其關連的形式有很多種,最常見的關連為線性的共變關係。 隨機變數 X,Y 間的線性關係可用兩個統計量來測量 (1) 共變數 (covariance) (2) 相關係數 (correlation coefficient) 。 兩者都能衡量兩變數之間是否有 線性關係 存在。. Stochastic Relationships and Scatter Diagrams. 觀念.
E N D
社會統計 第十講 相關與共變 社會統計
Covariance, 共變量 觀念 • 當X, Y兩隨機變數不互為獨立時,表示兩者間有關連。其關連的形式有很多種,最常見的關連為線性的共變關係。 • 隨機變數X,Y間的線性關係可用兩個統計量來測量(1) 共變數(covariance) (2) 相關係數 (correlation coefficient)。兩者都能衡量兩變數之間是否有線性關係存在。 社會統計
Stochastic Relationships and Scatter Diagrams 觀念 • Scatter Plot可以顯示兩連續變數x, y之間的關聯形式與強度: 依 變項y 自變項x 社會統計
Y X與Y之間的關係為線性還是非線性? X (a) 社會統計
Y X與Y之間的關係為線性還是非線性? X (b) 社會統計
Y X與Y之間的關聯強度為何? X (c) 社會統計
Y X與Y之間的關係是正向還是反向? X (d) 社會統計
Covariance, 共變量 觀念 • 我們用簡單圖形可以來瞭解兩變數x與y之間的關係。另一種分析兩變數關係的統計技術為相關分析(correlation analysis)。 • 兩個隨機變數之間的共變關係為何? 社會統計
Covariance, 共變量 觀念 • 假設兩隨機變數Y與X之間具有某種關聯,母體X的平均值為ux、母體變異數σx2,母體Y的平均值為uy、母體變異數σy2, 樣本變異數 母體變異數 社會統計
Covariance, 共變量 觀念 • 測量兩變數之間是否有關連的一個有效指標為共變數(covariance) 社會統計
Covariance, 共變量 觀念 先生的收入(x)與太太的收入(y)關係如下表,請計算共變量(covariance) 社會統計
Covariance, 共變量 觀念 社會統計
Covariance, 共變量 觀念 社會統計
例題 求x與y的covariance? 社會統計
⊕ I II (14-10)(8-5) =(4)(3) (6-10)(3-5)=(-4)(-2) ⊕ III IV 社會統計
⊕ I II (13-10)(8-5) =(-3)(3) (5-10)(8-5)=(-5)(3) ⊕ III IV 社會統計
Covariance, 共變量 觀念 • 證明: 社會統計
Covariance, 共變量 觀念 • 證明:if X, Y are independent, 社會統計
The Population Correlation Coefficient, ρ母體相關係數 • 用共變量來衡量兩變數的關係有一個缺點,即σxy及sxy的值會受到x與y衡量單位的影響。 社會統計
The Population Correlation Coefficient, ρ母體相關係數 • 因此,我們將covariance分別除上x與y的標準差σx、σy,得到標準化後的指標稱之為相關係數: 社會統計
Sample Correlation Coefficient, r樣本相關係數 • 樣本相關係數: 社會統計
相關係數的特性 • 相關係數衡量兩變數之間是否有線性關係,相關係數愈大,代表兩變數之間的線性關係愈強。相關係數為零,代表兩變數沒有線性關係。 • 相關係數的值介於正負1之間,正1代表兩者呈完全正相關,負1代表兩者呈現完全負相關。 • 如果x與y為獨立,則相關係數ρ=0。 • 如果ρ=0,x與y不一定為獨立,因為他們可能具有非線性關係。 社會統計
相關係數的特性 • 證明:若x為y之線性函數y=a+bx,則x與y的相關係數為±1。 社會統計
r = 0.8 Y X (a) 社會統計
Y r = .95 X (b) 社會統計
Y r = 0 X (c) 社會統計
Y r = 0 X (a) 社會統計
Y r = -.90 X (d) 社會統計
Y r = -0.5 X (c) 社會統計
相關係數的強弱 • r = 1 為完全相關 • r = 0 為無相關 社會統計
例題 求x與y的correlation? 社會統計
例題 求x與y的correlation? 社會統計
母體相關係數的檢定 • 樣本相關係數r為母體相關係數的估計式。 若(x, y)為一組具有雙邊常態分配(bivariate normal distribution)的隨機變數 社會統計
母體相關係數的檢定 • 利用檢定斜率的公式: 相當於檢證 社會統計
例題 • 續上例 社會統計
相關係數與因果關係 • 相關僅代表兩變數間有線性關係,不必然隱含因果關係,下列情況皆有可能 z Two variables are said to be spuriously correlated when their correlations is nonzero and there is no reason to believe that the variables are related to one another. 社會統計
相關係數與因果關係 • 商品的價格愈高,需求愈低? • 美國職業運動的票價每年都在增長,但需求不減反增。 • 相關分析僅考慮兩個變數x, y 之間的關係,而忽略其他可能影響y的因素。 • 人口增加、收入增加、職業運動受歡迎的程度增加等 社會統計
相關係數不受單位尺度變換的影響 社會統計
例題 • 某校MBA畢業生的在學成績(x)與工作起薪(y)的資訊如下: • 求r並檢定H0: =0 社會統計
例題 社會統計