540 likes | 1.03k Views
統計分析方法. 單因子變異數分析 多重比較 雙因子變異數分析. 變異數分析 (ANOVA). 變異數分析 ( An alysis o f Va riance) 可比較不同族群的反應是否不同。 透過實驗設計取得嚴格管控下各處理的資料的,可以證實因果關係 例如:某種特定處理組合下,可以取得最佳的反應值。 問卷調查的資料,或是其他觀察性資料,只能做各種處理組合之見是否有差異,無法證實為因果關係。 例如:不同年齡層對特定議題的支持率是否有差別。. 變異數分析模式. 根據變數的特質,可以討論下列分析模式: 單因子變異數分析; 主因子效應及多重比較。 雙因子變異數分析;
E N D
統計分析方法 單因子變異數分析 多重比較 雙因子變異數分析
變異數分析(ANOVA) • 變異數分析(Analysis of Variance)可比較不同族群的反應是否不同。 • 透過實驗設計取得嚴格管控下各處理的資料的,可以證實因果關係 • 例如:某種特定處理組合下,可以取得最佳的反應值。 • 問卷調查的資料,或是其他觀察性資料,只能做各種處理組合之見是否有差異,無法證實為因果關係。 • 例如:不同年齡層對特定議題的支持率是否有差別。
變異數分析模式 • 根據變數的特質,可以討論下列分析模式: • 單因子變異數分析; • 主因子效應及多重比較。 • 雙因子變異數分析; • 主因子效應、交互作用。 • 多因子變異數分析; • 一般多因子、2k因子、 3k因子等效應。
單因子變異數分析實例 • 四家公司分別生產之輪胎平均壽命是否有顯著性差異? • 每一家公司之輪胎將分別觀察10 次。 • 實驗設計中,各實驗順序以隨機方式進行。 • 實驗順序隨機,各輪胎壽命之觀察平均結果比較不因實驗時間,地點及氣候等因素產生偏誤。 • 各觀察值之間,可假設為統計獨立。
資料 • 資料如下: • 總平均為83.325
單因子實驗設計模式 • Yij為第 i家輪胎(組)第j次之觀察值, i = 1,.., k, j =1,..., ni。 • 假設m 為總效應,ai為第i家輪胎的主效應,eij為觀察誤差,則模式為Yij = m + ai + eij • 假設eij服從常態 N(0, s2),且互相獨立。
單因子實驗設計模式 • 以 mi = m + ai代表第 i家輪胎的平均壽命,則可檢定各家平均壽命是否相同: • H0: m1 = m2 = … = mk v.s. H1: not H0 • 或直接以 ai檢定各家效應是否為零: • H0: a1 = a2 = … = ak= 0 v.s. H1: not H0
單因子模式參數之估計 • 第i家輪胎的平均壽命 mi,主效應 ai 及總平均壽命 m的估計值分別為其中
平方和的分解 • 則
平方和的分解(續) • 定義組間平方和(B) 組內平方和(W)總平方和 • 則
各參數估計的分配 • 假設 則
平方和的分配 • SSE 的分配: • SSTr 的分配: (在H0之下)則
處理間等效檢定 • 則各均方和的期望值為
殘差分析 • 在隨機、常態、相同變異數的假設下,變異數分析的 F 統計量服從非中心F 分配。 • 在 H0為真的情形下, F 統計量服從 (中心) F 分配。檢定結果才能保證推論錯誤率的控制。 • 在做推論之前要先確認模式假設並不違背,我們以誤差項的估計值–殘差做分析,又稱為殘差分析。 • 包括:常態性檢定、裨益數齊一檢定及隨機獨立性檢定等。
變異數齊一性之檢定 • 變異數分析是在各組變異數相等的假設下,檢定各組處理效果是否相等。 • 假設各組變異數分別為 ,哈雷在樣本數相等(或很接近)提出哈雷檢定法,檢定之假說為: v.s. H1:至少有兩組變異數不相等。
哈雷檢定法 • 假設各組樣本變異數分別為 ,在 H0為真時, 接近1。 • 檢定統計量 H> Hk,n,a 時拒絕 H0。其中臨界點 Hk,n,a 由哈雷提出,可藉由查表取得。在實用上,樣本數很接近時,n為各組樣本數平均。
多重比較 • 多重比較(Multiple Comparison Procedures 簡稱MCP)的比較方法 • 建立同質性的聯合信賴區間 (Simultaneous Confidence Intervals) • 使用多重步驟的檢定方法 (Multiple stage testing procedures) • 多重比較方法的特點為錯誤率的控制。
錯誤率(Error Rates) • F :一組統計敘述族(family of statements) • 極保守的統計學者也許會把他一生所一下的統計決策當作一個整體,而試圖控制整體的誤差率 • 另一極端的情形,則是將每個個別的統計敘述獨立作決策,即使每次有興趣的是多個相關的統計決策。 • 常用的統計敘述族為與均值檢定的H0等價的敘述,即與 H0: m1 = m2 = … = mk等價的敘述。
常用的多重比較的型態 • 與均值檢定的H0 :m1 = m2 = … = mk等價的敘述。 • 配對比較的型態 • 全配對比較、與控制組比較、與最佳組比較。 • 特定組合比較 • 對照contract比較。
配對多重比較方法 • 全配對的比較(all pair-wise multiple comparisons, MCA:,mi-mji≠ j • Fisher’s least significant、Bonferroni、Tukey、Scheffe • 與控制組的比較(multiple comparisons with the control, MCC):mi-m0 ,i = 1,2,…,k • Dunnett • 與最佳組的比較(multiple comparisons with the best, MCB):mi-max(1≦j≦a)mj • Hsu
多重比較檢定 全配對比較檢定 與控制組比較檢定 與最佳組比較檢定
Fisher’s 檢定 • Fisher’s Least Significant Distance Test B/w MS = 2.6750, df =16
Tukey’s MCA檢定 • Tukey’s H Significant Distance Test B/w MS = 2.6750, df =16
Bonferroni’s MCA檢定 • Bonferroni’s MCA Test B/w MS = 2.6750, df =16
Scheffe’s MCA檢定 • Scheffe’s MCA Test B/w MS = 2.6750, df =16
Dunnett’s MCC檢定 • Dunnett’s MCC Test B/w MS = 2.6750, df =16 (蘋果為控制組) (柳丁為控制組)
雙因子模式中的交互作用 • 兩個主因子模式就有可能會有兩因子間的交互作用。 • 以廣告與陳列對產品購買意願的雙因子變異數分析模式為例,分別探討兩因子間之交互作用的情形。 • 沒有交互作用、正向交互作用、逆向交互作用。
沒有交互作用 • 沒有交互作用之例: • 廣告與陳列對咖啡購買意願之交互作用。 咖啡購買意願 咖啡購買意願 有廣告 有陳列 6 6 4 4 3 3 沒廣告 沒陳列 1 1 沒廣告 有廣告 沒陳列 有陳列
正向交互作用 • 有正向交互作用之例: • 廣告與陳列對餅乾購買意願之正向交互作用。 餅乾購買意願 餅乾購買意願 14 14 有廣告 有陳列 6 6 5 5 沒陳列 沒廣告 2 2 沒廣告 有廣告 沒陳列 有陳列
逆向交互作用 • 有逆向交互作用之例: • 廣告與陳列對奶昔購買意願之逆向交互作用。 奶昔購買意願 奶昔購買意願 有陳列 8 8 有廣告 7 7 4 4 沒廣告 沒陳列 1 1 沒陳列 有陳列 沒廣告 有廣告
交互作用對分析的影響 • 有交互作用之資料,不應討論個別因素的主效用,只能直接討論各種配方組合的差異性。
雙因子變異數分析 • 雙因子變異數分析模式: • Yijk = m + ai + bj+abij + eijk , i = 1,…,a, j = 1,…,b, k = 1,…,r。 • 在常態獨立誤差 的假設下,各因子效應估計值服從常態。
雙因子變異數分析 • 總平方和可分解為 SST= SSA+ SSB+ SSAB+ SSE, • 其中各平方和為 • 各因子效應平方和服從卡方分配; • 主因子效應、交互作用效應平方和與誤差平方和互相獨立。 • 兩獨立均方和相除服從 F分配。
雙因子模式之交互作用檢定假說 • 交互作用之檢定假說: • 在 H0為真之下,檢定統計量 FAB服從 F分配。
主因子之檢定假說 • 如果交互作用不存在,則可 • 檢定主效用 A 是否顯著: • 在 H01為真之下,檢定統計量 FA服從 F分配。 • 檢定主效用 B 是否顯著: • 在 H02為真之下,檢定統計量 FB服從 F分配。 • 交互作用不存在之下,可進一步做主因子各水準間的多重比較。