1 / 32

第十三章 相關

第十三章 相關. 簡單相關係數 CORREL(). 所謂相關是指變項間相互發生之關聯,若僅是分析兩組資料間之相關,我們稱簡單相關;若是分析多組資料間之相關,則稱之為複相關。 要瞭解簡單相關,通常有二種方式,一為繪製資料散佈圖(即 Excel 之 XY 圖),另為計算簡單相關係數(亦即表示相關程度大小及正負之量數)。 於 Excel ,計算簡單相關係數,可直接使用 CORREL() 函數,其語法為: CORREL( 範圍 1, 範圍 2) CORREL(array1,array2) 本函數用以計算兩組數字範圍之簡單相關係數,兩組數字範圍之資料點必須相同。.

kuame-marks
Download Presentation

第十三章 相關

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第十三章 相關

  2. 簡單相關係數CORREL() • 所謂相關是指變項間相互發生之關聯,若僅是分析兩組資料間之相關,我們稱簡單相關;若是分析多組資料間之相關,則稱之為複相關。 • 要瞭解簡單相關,通常有二種方式,一為繪製資料散佈圖(即Excel之XY圖),另為計算簡單相關係數(亦即表示相關程度大小及正負之量數)。 • 於Excel,計算簡單相關係數,可直接使用CORREL()函數,其語法為: CORREL(範圍1,範圍2) CORREL(array1,array2) 本函數用以計算兩組數字範圍之簡單相關係數,兩組數字範圍之資料點必須相同。

  3. 簡單相關係數之計算公式為: • 相關係數係一介於-1到+1之數字 • 其情況可有下列三種: =0 無關 >0 正相關 <0 負相關 當相關係數之絕對值達小於0.3時,為低度相關;絕對值介於0.3~0.7時,即為中度相關;達0.7~0.8時,即為高度相關;若達0.8以上時,即為非常高度相關。

  4. 範例Ch13.xlsx『廣告費與銷售量』工作表,為一年度每月份之廣告費與銷售量之數字;以範例Ch13.xlsx『廣告費與銷售量』工作表,為一年度每月份之廣告費與銷售量之數字;以 =CORREL(B2:B13,C2:C13) 可算出其相關係數為0.923,表銷售量與廣告費間存有極高度之正相關,銷售量會隨廣告費遞增而明顯增加:

  5. 繪製資料散佈圖(XY散佈圖) • XY散佈圖通常用以探討兩數值資料之相關情況,如:廣告費與銷售量之關係、年齡與所得之關係、所得與購買能力之關係、每月所得與信用分數之關係、……。 • 在X軸之資料稱為自變數;Y軸之資料稱為因變數;利用XY圖即可判讀出:當X軸資料變動後,對Y軸資料之影響程度。如:隨廣告費逐漸遞增,銷售量將如何變化? • 繪製XY散佈圖時,所有數列資料均必需為數值性資料(圖例及標記文字除外),若安排字串標記將被視為0,其所繪之圖形即無任何意義。 • 假定,要依範例Ch13.xlsx『廣告費與銷售量』工作表之資料,來繪製廣告費與銷售量之XY散佈圖,其執行步驟為: • 選取B1:C13之連續範圍

  6. 切換到『插入』索引標籤『圖表』群組,選擇欲繪製『帶有資料標記的XY散佈圖』產生XY散佈圖,稍加移動其位置:切換到『插入』索引標籤『圖表』群組,選擇欲繪製『帶有資料標記的XY散佈圖』產生XY散佈圖,稍加移動其位置:

  7. 切換到『圖表工具/設計』索引標籤,點選『圖表版面配置』群組之『版面配置1』切換到『圖表工具/設計』索引標籤,點選『圖表版面配置』群組之『版面配置1』 • 點選圖例『 』,按Delete將其刪除;分別點選圖表標題、X與Y軸標題之文字方塊,輸入新內容『廣告費與銷售量之關係圖』、『廣告費』與『銷售量』

  8. 以右鍵單按Y軸銷售量之數字,續選「座標軸格式(F)…」,轉入『座標軸格式』之『刻度』標籤,將「最小值」改為1000(點選『最小值』處之「固定(F)」,續於其後輸入1000)以右鍵單按Y軸銷售量之數字,續選「座標軸格式(F)…」,轉入『座標軸格式』之『刻度』標籤,將「最小值」改為1000(點選『最小值』處之「固定(F)」,續於其後輸入1000)

  9. 按鈕結束 • 以右鍵單按X軸廣告費之數字,續選「座標軸格式(F)…」,轉入『座標軸格式』之『刻度』,將「最小值」改為100

  10. 按鈕結束,獲致新XY散佈圖,可輕易看出銷售量會隨廣告費遞增而明顯增加按鈕結束,獲致新XY散佈圖,可輕易看出銷售量會隨廣告費遞增而明顯增加

  11. 馬上練習 • 以範例Ch13.xlsx『成績』工作表內容計算其相關係數,並繪製國文及英文成績之XY圖,是否可看出國文成績較高者,其英文成績也同樣會較高?

  12. 馬上練習 • 以範例Ch13.xlsx『學童』工作表內容計算其相關係數,並繪製XY圖,查看學童之仰臥起坐與伏地挺身個數之相關情況:

  13. 使用『資料分析』求相關矩陣 • 前例之CORREL()函數,僅能求算兩組資料間之相關係數。若使用『資料分析』,還可計算出多組資料間之相關係數,組成一個相關係數表。 • 範例Ch13.xlsx『汽車』工作表,收集到有關汽車鈑金、省油與價格之滿意度資料: • 擬以『資料分析』進行計算其相關係數表。其步驟為: • 切換到『資料』索引標籤, 點選『分析』群組『資料分析』鈕, 於『分析工具』處選選「相關係數」

  14. 續按鈕 • 於『輸入範圍』處,設定兩組資料之範圍(本例為A3:C17) • 將『分組方式』安排為「逐欄(C)」 • 點選「類別軸標記在第一列上(L)」(因各組資料均含標題之字串標記) • 設定輸出範圍,本例安排於目前工作表之E3位置

  15. 按鈕,結束 • 即可獲致多組資料之相關係數表(因為對稱矩陣,故顯示一半即可): • 依此結果,顯示『鈑金與省油』及『鈑金與價格』之滿意度間均呈高度負相關,對鈑金越滿意對其省油與價格將越不滿意。鈑金好的車身重量大,當然較不省油,且其售價一般也比較高。另外,『省油與價格』之滿意度間則呈高度正相關,因省油的車一般價位比較低之故。

  16. 馬上練習 • 以範例Ch13.xlsx『相關矩陣』工作表之內容:求本班學生上學期之總平均成績、出席率、選修學分數與每週打工時數間之相關係數表:

  17. 馬上練習 • 以範例Ch13.xlsx『數位相機』工作表:求各屬性間之相關係數表:

  18. 母相關係數之檢定(小樣本) • 由於,相關係數會受樣本數大小影響。於求得前面之相關係數後,我們都會有一困惑,到底多大的相關係數,才可以說兩變數之間存有顯著相關?

  19. 以rα檢定 • 若母體為常態分配,且母均數(μ1、μ2)與母變異數(σ12、σ22)均為已知,於樣本數n≦30,母相關係數ρ之檢定是以自由度n-2之t分配進行,其虛無假設與對立假設為:H0: ρ=0(無關)H1: ρ≠0(相關) • 於求得樣本之相關係數(r)後,若 得棄卻虛無假設; • 若 得接受虛無假設。

  20. 式中,所使用之t值,是使用自由度n-2之t分配求得(雙尾)。式中,所使用之t值,是使用自由度n-2之t分配求得(雙尾)。 • 以範例Ch13.xlsx『檢定相關係數』工作表,於α=0.05、n=11、d.f.=9、所計算之rα=0.6021>r=0.4848,故得接受母相關係數為0之虛無假設;也就是成績與出席率之間無關:

  21. 馬上練習 • 以範例Ch13.xlsx『檢定相關矩陣』工作表之內容:

  22. 只要相關係數之絕對值>0.6021即表示兩者相關。可發現,選修學分與出席率存有顯著正相關,選修學分愈高者,通常較認真,其出席率也較高;每週工作時數與總平均成績間存有顯著負相關,打工時數愈多者,其成績會愈低。 • 以α=0.05,以先前所計算出rα=0.6021逐一配對檢定,利用檢定相關矩陣內之變數,是否相互存有顯著相關?

  23. 以t檢定 • 另一種檢定方式為H0: ρ=0(無關)H1: ρ≠0(相關) • 於求得樣本之相關係數(r)及樣本數後,以 計算t值,然後查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2)值。當即棄卻虛無假設。

  24. 前面,範例Ch13.xlsx『檢定相關係數』工作表之資料,其t值為即E12之=(E1*SQRT(E3))/SQRT((1-E1^2))前面,範例Ch13.xlsx『檢定相關係數』工作表之資料,其t值為即E12之=(E1*SQRT(E3))/SQRT((1-E1^2)) • 於α=0.05、d.f.=9、查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2)值得到2.262(也可直接以=TINV(雙尾機率,自由度)求得,即E5之=TINV(E4,E3)) • 由於,t並未落入棄卻域,故也是得接受母相關係數為0之虛無假設,成績與出席率之間無關。

  25. 當然,也可以將1.66及自由度9代入TDIST(t值,自由度,單尾或雙尾)函數,以E13之=TDIST(E12,E3,2)求得P值為0.13>α=0.05,同樣可判斷出無法棄卻虛無假設:

  26. 如果,以範例Ch13.xlsx『成績與打工時數』工作表之資料,其t值為如果,以範例Ch13.xlsx『成績與打工時數』工作表之資料,其t值為 即E7之 =(E2*SQRT(E4))/SQRT((1-E2^2)) • 於α=0.05、d.f.=9、查『附錄四 t方分配的臨界值』自由度n-2之tα/2(n-2)值得到2.262(即E6之=TINV(E4,E3)) • 由 或由E8以 =TDIST(ABS(E7),E4,2) 因為t為負值故取其絕對值 計算之P值為0.01<α=0.05。均得判斷出應棄卻母相關係數為0之虛無假設,亦即成績與打工時數間存有顯著之負相關:

  27. 母相關係數之檢定(大樣本) • 若母體為常態分配,於樣本數n>30,母相關係數ρ之檢定是以標準常態分配進行,其虛無假設與對立假設為: H0: ρ=0(無關) H1: ρ≠0(相關) • 於求得樣本之相關係數(r)後,若 得棄卻虛無假設;若 則無法棄卻虛無假設。

  28. 而此Zα/2值,可直接以=NORMSINV(1-α/2)求得。如α=0.05,Zα/2值為1.96:(詳範例Ch13.xlsx『Z值』工作表)

  29. 範例Ch13.xlsx『軟體x操控性』工作表,為消費者對數位相機『與電腦配合執行的軟體』與『操控性(穩定度、速度等)』兩屬性之注重程度,於α=0.05、Zα/2值為1.96、n=98、r=0.651代入範例Ch13.xlsx『軟體x操控性』工作表,為消費者對數位相機『與電腦配合執行的軟體』與『操控性(穩定度、速度等)』兩屬性之注重程度,於α=0.05、Zα/2值為1.96、n=98、r=0.651代入 由所計算之故得棄卻母相關係數為0之虛無假設;也就是數位相機之『與電腦配合執行的軟體』與『操控性(穩定度、速度等)』兩屬性之注重程度間存有顯著相關:

  30. 馬上練習 • 範例Ch13.xlsx『清晰X速度』工作表之內容,為消費者對數位相機『畫素色彩是否清晰』與『內建記憶體容量及速度』兩屬性之注重程度:求兩者之相關係數,並檢定其是否存有相關:

  31. 第十三章 結束謝謝!

More Related