1 / 75

C h 9 Canonical Correlation

C h 9 Canonical Correlation. 9.1 引言. 關係模式. 多變量. 9.1 引言. - Principal Component Analysis - Exploratory Factor Analysis - Confirmatory Factor Analysis - Multidimensional Scaling - Cluster Analysis. 分析變數間或觀察值間的關聯的型態。. 相依關係分析 Analysis of interdependence. - Canonical Correlation.

presley
Download Presentation

C h 9 Canonical Correlation

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Ch 9Canonical Correlation

  2. 9.1 引言

  3. 關係模式 多變量 9.1引言 - Principal Component Analysis - Exploratory Factor Analysis - Confirmatory Factor Analysis - Multidimensional Scaling - Cluster Analysis 分析變數間或觀察值間的關聯的型態。 相依關係分析 Analysis of interdependence - Canonical Correlation 用一組自變數(independent variable)的資訊來解釋另一組應變數(dependent variable)的變異。 - Structural Equation Model with Latent Variables - Analysis of variance - Discriminant Analysis - Logit Choice Models 依賴關係分析 Analysis of dependence

  4. 多變量 9.1引言

  5. 本章將: 解釋典型相關的原理。 解釋如何用典型負荷量(canonical loadings)來解讀典型變量(canonical variates)。 提供檢定每一對典型變量的典型相關的顯著性(significance)之方法。 介紹評估典型相關分析結果的效度的方法。 多變量 9.1引言

  6. 在許多典型相關的應用上,兩組變數在分析中不具相等地位(equal status)的。 多變量 9.1引言 目的 以其中一組自變數的資訊去解釋令一組自變數的變異 應變數 (dependent variables, Y) 被解釋變數 自變數 (independent variables, X) 解釋變數

  7. 瞭解一組資料裡的依賴關係方法之一 多變量 9.1引言 方法 複迴歸分析 • 複迴歸中,應變數只有一個,因此必須重複跑模型,將所有X(自變數)對每一個Y(應變數)分別做迴歸。 • 典型相關:可同時考慮多個Y,用少數典型變量來解釋最多X’s與Y’s之間的關係。

  8. 由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推廣了它的應用。 ANOVA是一般線性迴歸的特例;MANOVA則是典型相關分析的特例。 兩群區別分析是迴歸分析的特例;多群區別分析則是典型相關分析的特例。

  9. 相依及依賴性關係之探索 心理學 行銷 作業管理文獻 突破休閒體驗研究 利用典型相關確認相關性的存在之後, 再作後續的分析。 多變量 9.1引言 9.1.1可能之應用 • 研究人格特質與職業興趣之間的關係 • Cooley and Lohnes,(1971):發現三對典型 • 變量,能夠簡便地描述會對某特定類型的 • 工作最感興趣之類型的人。 • Thorndike, Dawis, and Weiss,(1968):職業興 • 趣與職業需求之間之多變量關係。作者找 • 出兩對典型變量之證據可供交叉驗證研 • 究。

  10. 相依及依賴性關係之探索 心理學 行銷 作業管理文獻 突破休閒體驗研究 利用典型相關確認相關性的存在之後, 再作後續的分析。 多變量 9.1引言 9.1.1可能之應用 • 瞭解行銷活動(如 廣告、促銷、包裝、價 • 格等)與消費者回應(如 品牌態度、購 • 買意向和願付價格)之間的關係是很重要的。 • Fader and Lodish (1990):檢視不同種類產品 • 特徵(如 購買頻率、市場滲透)與所應用的 • 促銷策略(如 特別展示、特色廣告、製造商折價券)之間的關係。但事實上他們採用因素分析、集群分析和區別分析而非典型相關的方法;在本單元我們將用典型相關來分析他們的資料。

  11. 相依及依賴性關係之探索 心理學 行銷 作業管理文獻 突破休閒體驗研究 利用典型相關確認相關性的存在之後, 再作後續的分析。 多變量 9.1引言 9.1.1可能之應用 • Pisharodi and Langley (1991):顧客服務與市 • 場回應之間的關係,使用食品雜貨業之供 • 應商-顧客資料。此研究辨識出,那些服 • 務因素是對顧客回應的變異較具重要的解 釋能力(如設計、交付與溝通)。

  12. 相依及依賴性關係之探索 心理學 行銷 作業管理文獻 冒險性的休閒體驗研究 利用典型相關確認具有相關性後, 再作後續的分析。 多變量 9.1引言 9.1.1可能之應用 • Ewert and Hollenhorst (1994):個人的量測(如經驗、技巧、 涉入和掌控慾望)與休閒 • 設施(如自然性、社會取 • 向、設備需求)之間的關係。 • 在兩個不同樣本的分析中(泛 舟群體和攀岩群體),他們發 現是兩組變數間具顯著相關。

  13. 相依及依賴性關係之探索 心理學 行銷 作業管理文獻 突破休閒體驗研究 利用典型相關確認具有相關性後, 再作後續的分析。 多變量 9.1引言 9.1.1可能之應用

  14. 9.2 典型相關:原理

  15. (三)典型相關分析示意圖 X Y X1 Y1 X2 Y2 CanR1 CanR2 CanR3 CanR4 CanR5 u1 u2 u3 u4 u5 t1 t2 t3 t4 t5 X3 Y3 X4 Y4 X5 Y5 X6

  16. 9.2.1Intuition 複廻歸分析中,我們選擇模型參數值以降低觀察值與其適配值之間的誤差平方和。(最小平方估計法) 我們以不同的方式來求回歸參數: 雖然結果與最小平方法是一樣的,但目標函數不同。 原理:找出可讓與單一應變數Y的相關性達到最大值之自變數X的線性組合。 多變量 9.2典型相關: 如何運作

  17. 多變量 9.2典型相關: 如何運作 Y和X已標準化 = 1 自由度 9.2.1直覺 Y和Xb之相關係數 (9.1) 受限制 極大化 將b向量參數尺度化, 使得var(Xb)=1 (9.2) Chooseb to maximize Such that

  18. 導入拉氏乘數

  19. 多變量 9.2典型相關: 如何運作 9.2.1直覺 關於b之一階條件 (9.3) (9.4) 最小平方法 的估計式 (9.5)

  20. 多變量 9.2典型相關: 如何運作 典型變量 它們之間的相關: 典型相關 t和u之間的相關係數 9.2.1直覺 • 此方法的好處:可簡單的擴展到一個以上應變數 (9.6)

  21. 多變量 9.2典型相關: 如何運作 四 變 數 之 相 關 矩 陣 9.2.1直覺 Y的相關係數矩陣 YX的相關係數矩陣 最高相關係數 XY的相關係數矩陣 X的相關係數矩陣 Table 9.1 Correlation matrix for 4 variables: Y1,Y2,Y3 and Y4

  22. 多變量 9.2典型相關: 如何運作 9.2.1直覺

  23. 多變量 9.2典型相關: 如何運作 0.316 RXY 0.221 0.445 0.168 9.2.1直覺 > 0.445 計算典型相關。 具最高相關係數將是(接近)結果。 (0.767)2= 50%典型變量之解釋程度。 • 11x11格=121

  24. 多變量 9.2典型相關: 如何運作 9.2.1直覺 Figure 9.2 Scatter plot of canonical variates from illustration 兩典型變量之間具有強相關性

  25. 找出t和u典型變量之後,再找出第二對以及隨後的幾對。找出t和u典型變量之後,再找出第二對以及隨後的幾對。 主成分: 要辨認出第二個主成分,其必須與第一個主成分是無相關的。 典型相關: t2和u2,也必須與第一對是無相關的。 多變量 9.2典型相關: 如何運作 9.2.1直覺

  26. 多變量 9.2典型相關: 如何運作 9.2.1直覺 選a2和b2將 最大化 (9.7)

  27. 最後兩個限制式確保不會得到:a2=a1 和 b2=b1 (即又回到第一對典型變量)。 當自由度以耗盡便可停止尋找典型變量。 解釋典型變量如同解釋探索性因子分析。 檢視原始變數與典型變量之相關矩陣—典型負荷。 與探索性因子分析不同之處,是不做轉軸來協助解釋。 由於我們較關心所能解釋的變異量,若將結果轉軸會因此改變典型的R2值。 多變量 9.2典型相關: 如何運作 9.2.1直覺

  28. 9.2.2Mechanics 多變量 9.2典型相關: 如何運作 選擇 將 最大值化 t1=Ya1 第二組變量之 第一個線性組合 找出 將 最大值化 (9.8) 第一對典型變量 t1和u1典型變量之間的相關係數 u1=Xb1 第一組變量之 第一個線性組合 t2=Ya2 第二對典型變量 u2=Xb2 t2和u2之間的相關係數且受限於以下條件: (9.9)

  29. 多變量 9.2典型相關: 如何運作 選擇 將 最大值化 9.2.2技巧 (9.10) 之目標函數分子 (9.11)

  30. 多變量 9.2典型相關: 如何運作 選擇 將 最大值化 9.2.2技巧 (9.10) (9.12)

  31. 多變量 9.2典型相關: 如何運作 a b ( ) ( ) = - - - - L a ' R b a ' R a 1 b ' R b 1 YX YY XX 2 2 拉氏乘數 9.2.2技巧 Lagrangian (9.14) (9.15) (9.16) 前乘a’ ∴α是典型相關 (9.11)典型相關 (9.17) =1

  32. 多變量 9.2典型相關: 如何運作 9.2.2技巧 (9.18) (9.19) *r(t,u) * RXX -1 (9.20) 特徵向量-特徵值問題 r2 = (典型相關)2

  33. 多變量 9.2典型相關: 如何運作 9.2.2技巧 • 相關矩陣可分割如以下: • 由於每一組只有兩個變量,因此最多只可抽取兩對典型變量。

  34. 多變量 9.2典型相關: 如何運作 9.2.2技巧 • RXX-1RXYRYY-1RYX 乘積矩陣如以下: • 其特徵值:0.59和0.02;表示第一和第二對典型變量的典型相關分別為0.77和0.14。 • 特徵向量如下: 0.92 ÷ (0.92+0.76) ≒ 60% 0.76 ÷ (0.92+0.76) ≒ 40% 0.73 ÷ (0.73+0.83) ≒ 40% 0.83 ÷ (0.73+0.83) ≒ 60%

  35. 多變量 9.2典型相關: 如何運作 9.2.2技巧 典型負荷 • 原始變量與典型變量之間的相關。 • X與u之間的相關性,以f代表: • Y與t之間的相關,由g代表: (9.21) (9.22)

  36. 多變量 9.2典型相關: 如何運作 9.2.2技巧 正負荷 典型相關 是否顯著? Table 9.3 Canonical loadings for simple four-variable illustration

  37. 多變量 9.2典型相關: 如何運作 9.2.2技巧 重疊指標 • 典型相關平方r2(t,u),只提供多少t(Y的一個線性組合)的變異數能被u所解釋(或反之)。 • 若要知道多少Y的變異數被X解釋,便可採用由Stewart and Love (1968)學者們所發展的重疊指標(measure of redundancy): r2 (t,u) 可由線性組合t=Ya解釋的Y變異數 (9.23)

  38. 多變量 9.2典型相關: 如何運作 相關性高 t1只能解釋: (.688)2 + (.480)2 /2 = 0.352 (≒35%) 0.59 x 0.35 = 0.21 9.2.2技巧 (9.24)

  39. 多變量 9.2典型相關: 如何運作 ≒2% ≒65% 9.2.2技巧 (9.24)

  40. 典型相關係數的標準誤

  41. 9.3 例題

  42. 在行銷研究中,消費者對促銷的反應一直侷限於高滲透及高購買頻率的產品類。在行銷研究中,消費者對促銷的反應一直侷限於高滲透及高購買頻率的產品類。 Fader and Lodish (1990)想瞭解不同產品類(根據不同產品特性)的促銷活動是否有差異? 他們從1968年IRI Marketing Factbook中,收集331種雜貨產品類在10個變數上的資料。 他們將10個變數分為兩個大項: Structural Variables (X) Promotional Variables (Y) 目的:找出結構變數(X)可以解釋促銷變數(Y)的變動程度 多變量 9.3 例題 9.3.1資料

  43. 多變量 9.3 例題 TABAL 9.5變數說明

  44. 多變量 9.3 例題 輸入各項變項名稱 $--字串 典型相關指令 VAR指令,典型變項的命名,設定為u WITH指令,典型變項的命名,設定為t VAR變項名稱串、WITH變項名稱串 繪圖指令 以t 為縱軸,u 為橫軸,catogory為含符號之變項名稱。 Vaxis:縱軸的單位 Haxis:橫軸的單位 9.3.1SAS 編輯檔

  45. 多變量 9.3 例題 (t1,u1) (t2,u2) (t3,u3) Reject H0,前三組組合有相關 累積解釋變異,前三組達98% Reject H0,兩組變數有相關 9.3.1SAS輸出檔

  46. 多變量 9.3 例題 9.3.1SAS輸出檔 Category tonnage High price Store-brands Penetration Purchase frequency Purchase cycle Private label Private label –Market share Price

  47. 多變量 9.3 例題 9.3.1SAS 輸出檔 Category tonnage High price Store-brands Manufacturer Promotion Retailer Promotion ??? Manufacturer's coupon Store coupon

  48. 多變量 9.3 例題 9.3.1SAS 輸出檔 Category tonnage High price Store-brands 0.483 0.265 0.642 Manufacturer Promotion Retailer Promotion ???

  49. 多變量 9.3 例題 Canned ham Paper towel Laundry det Coffee Crackers Cigarettes Magazine 9.3.1SAS輸出檔 Retailer Promotion 高滲透率,不方便攜帶 只有特定族群購買,則促銷活動較少 Category tonnage

  50. 多變量 9.3 例題 Diapers Coffee Cigarettes Eggs 9.3.1SAS輸出檔 Manufacturer Promotion 製造商品牌占優勢 製造商會作大量促銷活動 無製造商品牌 High price

More Related