500 likes | 628 Views
主題四、估計與假設檢定. 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士. 講授主題. 一、樣本與母體 二、無偏估計與效率 三、偏差估計與無偏估計的效率 四、一致性估計 五、區間估計 六、小樣本的區間估計 七、獨立樣本間平均數的差異 八、配對樣本間平均數的差異 九、百分比的區間估計 十、假設檢定. 幾個估計圖形. 一、樣本與母體. (一)推論統計所使用的三種方法 (二)推論統計的主題 (三)評估估計量好壞的標準. (一)推論統計所使用的三種方法. 母數統計 Parametric statistics
E N D
主題四、估計與假設檢定 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士 政治學研究方法班
講授主題 一、樣本與母體 二、無偏估計與效率 三、偏差估計與無偏估計的效率 四、一致性估計 五、區間估計 六、小樣本的區間估計 七、獨立樣本間平均數的差異 八、配對樣本間平均數的差異 九、百分比的區間估計 十、假設檢定 政治學研究方法班
幾個估計圖形 政治學研究方法班
一、樣本與母體 (一)推論統計所使用的三種方法 (二)推論統計的主題 (三)評估估計量好壞的標準 政治學研究方法班
(一)推論統計所使用的三種方法 • 母數統計Parametric statistics • 無母數統計Nonparametric statistics • 貝氏統計學Bayesian Statistics 政治學研究方法班
(二)推論統計的主題 • 統計估計 • 假設檢定 政治學研究方法班
統計估計的兩個類型 • 點估計 • 區間估計 政治學研究方法班
家庭食品年度支出(母體) 政治學研究方法班
家庭食品年度支出(N=100) 政治學研究方法班
(三)評估估計量好壞的標準 • 計算的成本(Computational cost) • 最小平方(Least squares) • 無偏(Unbiasedness) • 效率(Efficiency) • 大樣本不偏性(Asymptotic properties) 政治學研究方法班
二、無偏估計與效率 (一)、無偏 (二)、效率 政治學研究方法班
(一)無偏 • 當一個樣本的期望值等於他要推論的母體值時,我們就稱此估計量為無偏估計。用統計符號表示就是: • 就是樣本的期望值,而 是母體值。 政治學研究方法班
隨機樣本:母體參數與樣本估計 政治學研究方法班
(一)無偏的圖形 政治學研究方法班
(二)效率 有效較高的估計式是估計值較集中的估計法,也就是變異數較小的估計式。(請參考下圖) 假設有兩個估計式,他們的變異數分別是V與W,則相對有效性的計算方式為: V相對於W的效率程度= 政治學研究方法班
效率的圖形 政治學研究方法班
三、偏差估計與無偏估計的效率 同時考慮無偏與效率: 平均誤差平方(Mean Squared Error, MSE) : 政治學研究方法班
MSE的圖形 政治學研究方法班
四、一致性估計 當樣本趨近於無限大時,一致性的估計式所給我們的估計誤差,趨近於零,而且,該估計式的變異數也趨近於零。 大樣本不偏性:當樣本增至無限大時,估計的誤差為零。 政治學研究方法班
一致性估計的圖形 政治學研究方法班
五、區間估計 • 經過一般隨機抽樣程序所獲得的代表性樣本的相關資訊以及初步統計出來的有關母體的分布,只是根據樣本資訊來推估母體參數值的點估計,我們在解讀的時候,還必須將抽樣誤差一併呈現,這樣的推論才會較為合理。 政治學研究方法班
1.單一樣本的區間估計 為了讓我們的估計更有信心,我們會以區間估計(interval estimate)也就是考慮抽樣誤差後加入一些信賴區間(confidence interval)來做成我們的估計。所以 = 抽樣誤差 (6.6) 政治學研究方法班
百分之九十五的信心水準 • 一般而言,我們做區間估計時,以百分之九十五的信心水準為原則。 • 在雙尾檢定時,整個分佈的左右兩邊各佔所有分布的2.5%。用標準常態分布表可以發現其z值為1.96。所以,我們可以說,這一個點估計的上下各1.96個標準誤(standard error,或是SE)之下,是我們在百分之九十五信心水準之下的區間估計。也就是 • 「當我們運用以下區間估計 值時,有百分之九十五的機會, 會落在以下的區間中。」 • P( -1.96 SE < < +1.96 SE) = 95%(5.3) 政治學研究方法班
百分之九十五的信心水準 政治學研究方法班
六、小樣本的區間估計 一般而言,當樣本數小於30而且其分布屬於常態分布時,我們運用t分布。(查表參考593頁) 用t值做區間估計的公式是: = (6.12) t值自由度(degree of freedom, df)的計算方式是: df = N-1 (6.13) 政治學研究方法班
七、獨立樣本間平均數的差異 以百分之九十五信賴區間,兩套獨立樣本間的差異為: = ( ) (6.15) 如果兩個母體的變異數相同,公式可以改寫為: = ( ) (6.16) 政治學研究方法班
不知母體的變異數,獨立樣本間平均數之差異 不知道母體的變異數時,百分之九十五信賴區間,獨立樣本間的差異就變成: = ( ) (5.11) 而的計算方式,在假定兩個母體的變異數相同的情況下,它的計算公式為: = (5.12) 估計t分布的自由度的計算方式則是 df= ( )+( ) (5.13) 政治學研究方法班
八、配對樣本間平均數差異的估計 先計算個別選民評分的差異: D = - (6.20) 建構平均母體差異,△,的信賴區間: △= (6.21) (6.22) 也可以用以下的公式計算與表示 △ = = ( ) (6.23) 政治學研究方法班
九、百分比的區間估計 (一)單一大樣本的區間估計 (二)兩套獨立樣本差異的區間估計 政治學研究方法班
(一)單一大樣本的區間估計 • 以百分之九十五的信心水準而言,在大樣本時對母體百分比的區間估計公式為: (6.24) 其中, = 母體的比例 P = 樣本的比例 N = 樣本數 政治學研究方法班
(二)兩套獨立樣本差異的區間估計 • 例如,我們要估計兩個不同時間點所做的民意調查,是不是出現了顯著差異時,我們若是要對兩次訪問的差異進行比較,以百分之九十五信心水準而言,估計公式為: 政治學研究方法班
十、假設檢定 在統計上,有以下兩種假設。 1)虛無假設(null hypothesis) 通常用 來代表。 2) 對立假設(alternative hypothesis) 通常用 來表示,也有用 來表示的。 政治學研究方法班
統計假設的兩種決策 1)拒絕虛無假設 通常p值小於0.05。 2) 不拒絕虛無假設 通常p值大於或是等於0.05。 政治學研究方法班
兩種統計上假設檢定的錯誤類型 表7-1 統計檢定的兩種錯誤類型表 政治學研究方法班
幾個統計檢定常用的名詞 (1- )乘以100我們稱之為信心水準(confidence level)。 我們常說的百分之九十五信心水準,就是當 等於5%時,計算出來的結果。 又稱之為顯著程度(significance level),也就是我們犯下第一型錯誤的機率。 (1- )稱之為檢定力(power of a test)或是統計的效力(statistical power)。 政治學研究方法班
古典的假設檢定的步驟 1)設定虛無假設以及對立假設,並確定樣本數、標準差以及顯著程度,一般而言,統計上可以接受的顯著程度為0.05或是更小的值。 2)利用上述資訊找出統計檢定的判別值(critical value)(通常用Z*來表示)以及拒絕虛無假設的區域。 3)利用公式,計算觀察樣本的Z值。如果我們觀察樣本的Z值大於統計檢定的判別值,我們就拒絕虛無假設;否則,就不拒絕虛無假設。 政治學研究方法班
假設檢定判別值的決定 單尾檢定而言, 統計檢定決定的Z*值在α=0.05時為1.645。 雙尾檢定而言, 統計檢定決定的Z*值在α=0.05時為1.96。 而計算Z值的公式為 Z = (5.21) 政治學研究方法班
SPSS的具體操作:獨立樣本T檢定 我們要檢視不同性別對兩個政黨喜好程度是否存在顯著差異 TEDS2008PE 對國民黨喜好程度N2 對民進黨喜好程度N2A 性別S18 政黨喜好重新編碼成0~10(其他設為遺漏值) 政治學研究方法班
性別與主要政黨喜好差異 對國民黨喜好程度N2N 對民進黨喜好程度N2AN 假設此兩個變數為數字資料 性別S18:1男性;2女性 Analyze Compare Means Independent-Samples T-Test 政治學研究方法班
性別與主要政黨喜好差異KMT 統計的假設: 你的研究假設? 政治學研究方法班
性別與主要政黨喜好差異KMT Levene's Test for Equality of Variances 虛無假設:變異數相等 對立假設:變異數不相等 Sig<0.05看第二行資訊 Sig>0.05看第一行資訊 Sig, p值與統計的虛無假設 政治學研究方法班
性別與主要政黨喜好差異KMT 政治學研究方法班
性別與主要政黨喜好差異KMT 統計說明: 從表一的資訊中我們發現:t值為-1.864自由度為1,759,查表得知p>0.05,所以無法拒絕虛無假設,男性與女性對國民黨的評價並不具備統計上的顯著差異。 論文描述: 表一中我們發現:男性對於國民黨的評價分數為4.97,低於女性的5.20。不過,經過統計上的檢定我們得知,兩者並不具備統計上的顯著差異。本研究假設並未驗證。 政治學研究方法班
性別與主要政黨喜好差異DPP 研究假設: 統計的虛無假設與對立假設 政治學研究方法班
性別與主要政黨喜好差異DPP 統計說明: 從表二的資訊中我們發現:t值為2.034自由度為1,744,查表得知p<0.05,所以拒絕虛無假設,男性與女性對民進黨的評價具備統計上的顯著差異。 論文描述: 表二中我們發現:男性對於民進黨的評價分數為4.68,低於女性的4.43,且經過統計上的檢定我們得知,兩者具備統計上的顯著差異。本研究假設主張男性對民進黨的評價分數較女性為高,獲得支持。 政治學研究方法班
SPSS的具體操作:配對樣本T檢定 我們要檢視民眾對兩個政黨喜好程度是否存在顯著差異 Analyze Compare Means Paired-Samples T-Test 政治學研究方法班
民眾對兩個主要政黨喜好的差異 統計的假設: 你的研究假設? 政治學研究方法班
民眾對兩個主要政黨喜好的差異 政治學研究方法班
民眾對兩個主要政黨喜好的差異 統計說明: 從表三的資訊中我們發現:t值為5.007自由度為1,742,查表得知p<0.001,所以拒絕虛無假設,民眾對國民黨與民進黨的評價具備統計上的顯著差異。 論文描述: 表三中我們發現:民眾對於國民黨的評價分數為5.07,高於對民進黨的4.56,且經過統計上的檢定我們得知,兩者具備統計上的顯著差異。本研究假設主張:因為扁家弊案與國民黨勝選,使得民眾對國民黨的評價分數較民進黨顯著為高,此一主張獲得支持。 政治學研究方法班
SPSS的具體操作:單一樣本T檢定 我們要檢視民眾對政黨喜好程度與特定數值是否存在顯著差異 Analyze Compare Means One-Samples T-Test 政治學研究方法班