230 likes | 487 Views
變異數分析. ANOVA An alysis o f Va riance. 變異數分析. ANOVA An alysis o f va riance. 一組資料發生總變異,依可能發生變異的來源分割成幾個部份,測量這些變異來源,可了解各變異間是否有差異。. ANOVA. 平均數考驗方法 變異數分析 = 平均數差異的統計方法 探討類別變項對於連續變項的影響 ,平均數的差異成為主要分析重點 超過兩個以上的平均數的考驗。 運用 F 考驗來檢驗平均數間的變異量是否顯著的高於隨機變異量,又稱為變異數分析。
E N D
變異數分析 ANOVA Analysis of Variance
變異數分析 • ANOVA • Analysis of variance. • 一組資料發生總變異,依可能發生變異的來源分割成幾個部份,測量這些變異來源,可了解各變異間是否有差異。
ANOVA • 平均數考驗方法 • 變異數分析=平均數差異的統計方法 • 探討類別變項對於連續變項的影響,平均數的差異成為主要分析重點 • 超過兩個以上的平均數的考驗。 • 運用F考驗來檢驗平均數間的變異量是否顯著的高於隨機變異量,又稱為變異數分析。 • 平均數間的變異數(組間變異)除以隨機變異得到的比值(F值),來取代平均數差異與隨機差異的比值(t或Z值)
基本名詞 • 實驗單位(experimental unit)=實驗設計中所衡量的基本對象。 • 因子(factor)=衡量實驗單位的不同條件。 • 水準(level)=各因子所表現出的不同程度。 • 處理(treatment)=各因子的水準之特定組合。
Example • 假設將12塊田地予以隨機分成A、B、C三組,其中兩塊施以甲肥料﹙A﹚與乙肥料﹙B﹚,第三塊田則不施肥﹙C﹚,其產量結果如下,試求: • 請問本題之實驗單位﹙experimental unit﹚、因子﹙factor﹚、水準﹙level﹚為何?
變異數分析的基本假設 • 1.每個反應變數的母體均為常態分配。 • 2.每個母體的變異數均相等。 • 3.抽自各母體的各組隨機樣本互為獨立。
一因子變異數分析(one factor ANOVA): • 只關心一個因子。 • 二因子變異數分析(two factor ANOVA): • 同時探討兩個因子。
k種處理方式完全隨機化設計的資料結構 • 總變異=組間變異+組內變異(殘差) • 總平方和=組間平方和+組內平方和(殘差平方和) • SST=SSB+SSW(SSE)
SStotal=SSb+SSw • SST:依變項觀察值的變異。全體樣本在依變項得分的變異情形,即總離均差平方和。。 • SSB:導因於自變項影響的變異。組間離均差平方和。 • SSW:導因於自變項以外的變異,(隨機變異)。組內離均差平方和。=SSE • 各離均差平方和平均化後,得到均方和(MS),即為變異數的概念。
一般情形之完全隨機化設計的ANOVA表 F F=MSB / MSE
完全隨機化設計的F檢定 reject H0
Example • 假設將12塊田地予以隨機分成A、B、C三組,其中兩塊施以甲肥料﹙A﹚與乙肥料﹙B﹚,第三塊田則不施肥﹙C﹚,其產量結果如下,試求: • 1.請說明ANOVA的基本假設? • 2.建立ANOVA表? • 3.檢定施肥與否對產量是否有影響﹙α=0.05﹚? • 4.本題為one factor ANOVA,or two factor ANOVA?
Example • 某工廠欲了解4部機器的性能觀察其每小時產量,得到以下資料: • ﹙a﹚請問本題之因子﹙factor﹚、水準﹙level﹚為何? • ﹙b﹚本題為one factor ANOVA,or two factor ANOVA? • ﹙c﹚建立ANOVA表? • ﹙d﹚檢定4部機器的產量是否有差異α=0.05﹚[F0.05(3,18)=3.16]?
Example • 我們想了解甘藷的品種之蛋白質含量,今找出常見的三種甘藷品種,從每品種中任取四塊,並測定其蛋白質含量,得下表。請比較三種甘藷的蛋白質含量有無差異。 ﹙α=0.05﹚
事前比較(Priori comparison) • 基於理論或研究者的特定需求所進行的平均數考驗,又稱計畫性比較。 • 事前比較有其特定目的,因此不針對多次比較所累積的第一類型錯誤的膨脹機率進行校正。 • 事前比較運用t-test即可: t分數的計算改用是對誤差較佳的估計值。此時的自由度為N-K,查表D。
事後比較(Posteriori comparison) • 基於統計決策所所進行平均數考驗之後續考驗(follow-up test) • 在獲得顯著的F值之後所進行的多重比較,稱為事後比較(posteriori comparisons)
實驗性錯誤(experiment-wise error): • 使整個研究的第一類型錯誤維持衡定,此種第一類型錯誤稱為實驗性錯誤。(如HSD法)。 • 多組比較,用同一個臨界值(基於同一個誤差源)。 • 比較性錯誤(comparison-wise error): • 關心每一對配對比較的第一類型錯誤的一致性。(如N-K法)。 • 不同的組合,有不同的臨界值(基於不同的誤差)。
Scheff’s methed • 事後比較,適用於n不相等的多重比較 • 此一方法對分配常態性與變異一致性兩項假定之違反頗不敏感,且所犯第一類型錯誤(type I error)的機率較小。可以說是各種方法中最嚴格、檢定力最低的一種多重比較。
Scheff’s methed • Cohen(1996)甚至認為Scheffe執行前不一定要執行F整體考驗 • 因為如果F考驗不顯著,Scheffe考驗亦不會顯著 • 但是如果F整體考驗顯著,那麼Scheffe檢定則可以協助研究者尋找出整體考驗下的各種組合效果
隨機集區設計(randomized block design) • 將某影響因子分割成很多集區,成為實驗單位再隨機分派到不同處置(treatment),每個處置都有相同集區,進而去除此影響因子對測量值之影響。 • 集區(block)是一些欲控制影響因子之分層,如年齡,體重,社會經濟地位等。
ANOVA表 將總平方和分割成三部份:來自集區,來自處置,來自殘餘未知部份
Example • 從A、B、C三種教學方式的學生中各抽取,之樣本共20位同學,對其實施測驗,得下表成績與等級,試檢定三種教學方法是否有差異?