970 likes | 1.6k Views
假設檢定. 1. 統計推論. 假設檢定是統計推論的第二個類型。它也有很廣泛 的應用。 假設檢定的意義 對有關母體參數的假設,利用樣本的訊息,決定 接受 (Accept)( 不拒絕 ) 該假設或 拒絕 (Reject) 該假設的統計方法。 為了解其概念,我們將從非統計假設檢定開始。. 1. 假設檢定的非統計應用. 刑事審判是假設檢定的非統計的例子。 審判中 陪審團 必須在兩個假設中做決定 。 虛無假設 (null hypothesis) 為 H 0 : 被告是無罪的 ( 無罪推定原則 )
E N D
1. 統計推論 • 假設檢定是統計推論的第二個類型。它也有很廣泛 的應用。 • 假設檢定的意義 對有關母體參數的假設,利用樣本的訊息,決定接受(Accept)(不拒絕)該假設或拒絕(Reject)該假設的統計方法。 • 為了解其概念,我們將從非統計假設檢定開始。
1.假設檢定的非統計應用 • 刑事審判是假設檢定的非統計的例子。 • 審判中陪審團必須在兩個假設中做決定。虛無假設(null hypothesis)為 H0: 被告是無罪的 (無罪推定原則) • 對立(alternative) 或研究假設(research hypothesis)為 H1: 被告是有罪的 陪審團並不知道哪一個假設是正確的。他們必須要依據原告 和被告兩方提出的證據做決策。
有罪推定vs無罪推定有二個相同點1.若是很明顯罪證確鑿,都會判有罪2.若是很明顯罪證不足,都會判無罪有罪推定vs無罪推定有二個相同點1.若是很明顯罪證確鑿,都會判有罪2.若是很明顯罪證不足,都會判無罪 • 但是我們很難遇到黑白分明的案件大多時候都是處於灰色地帶有很多罪證,也有很多反證感覺被告絕對脫不了關係但又不確定是不是真兇這個時候有罪推定vs無罪推定就會有區別實益了若採有罪推定大多數的被告都要坐牢若採無罪推定大多數的被告都能安全下莊
為什麼是無罪推定?為何不是有罪推定?Ans: 〔我們寧可放過一百,也不願錯殺無辜〕 〔這樣才能保障人權啊!〕否則大多數被告都要坐牢了, 其中有一部分可能是無辜的人喔!Q: 若採無罪推定 ,大多數被告都無罪開釋其中有一部分可能是真兇! 讓壞人逍遙法外真的比較好嗎?讓兇手有機會再傷害別人會比較好嗎?下一個被害人是誰? • 其實並沒有證明無罪推定比有罪推定好, 只代表二件事1.我們無法證明那一種推定比較好2.但是我們比較喜歡無罪推定,所以選它
1. 假設檢定的非統計應用 • 在統計的術語宣判被告有罪 等同於拒絕虛無假設且支持對立假設 (rejecting the null hypothesis in favor of the alternative) 也就是,陪審團認為有足夠的證據做出被告有罪的 結論(有足夠的證據支持對立假設)。
1.假設檢定的非統計應用 • 宣判被告無罪如同說 不拒絕虛無假設且不支持對立假設 (not rejecting the null hypothesis in favor of the alternative) 注意陪審團並不是說被告是無罪的,只能說沒有足夠證據支持對立假設。這是為什麼我們從不說我們 支持虛無假設。
1.假設檢定的非統計應用 • 有兩種可能的錯誤。 • 型 I 錯誤(Type I error) 發生於當我們拒絕了一個真 實的虛無假設。在刑事審判中,犯型 I 錯誤是當一 個無罪的人被陪審團錯誤地宣判有罪。 • 型 II 錯誤(Type II error) 被定義成不拒絕一個錯誤 的虛無假設。型 II 錯誤的發生是當一個有罪的被告 被宣判無罪釋放。
1.假設檢定的非統計應用 • 犯型 I 錯誤的機率被表示成 ( 希臘字母alpha) , 它也被稱為顯著水準(significance level)。 • 犯型 II 錯誤的機率被表示成 ( 希臘字母beta • 兩種錯誤的機率 和 是反向相關的,意思是試圖降低其中一個將會造成另外一個的增加。
1.假設檢定的非統計應用 • 在我們的刑事審判制度,型 I 錯誤被視為是比較嚴 重的。 • 制度的安排是將犯型 I 錯誤的機率 α 設得很小,藉由將舉證的重擔放在原告( 控方必須證明被告有罪, 辯方無需證明任何事情),且陪審團只有在「證據超過合理的懷疑」時才得以宣判被告有罪。
1.假設檢定的非統計應用 假設檢定的重要觀念如下所述: • 有兩個假設,為虛無假設與對立假設。 • 檢定的程序以假設虛無假設為真開始。 • 過程的目的是要決定是否有足夠的證據去推論對立假設是真的。 • 有兩種可能的決策: • 結論認為有足夠的證據去支持對立假設。(Reject H0) • 結論認為無足夠的證據去支持對立假設。(Accept H0 )
1.假設檢定的非統計應用 • 任何檢定皆有兩種可能的錯誤。 型 I 錯誤:拒絕一個真的虛無假設 型 II 錯誤:無法拒絕一個錯誤的虛無假設 犯型 I 與型 II 錯誤的機率是 P ( 型 I 錯誤) = P ( 型 II 錯誤) =
2. 假設檢定之基本概念(1) (一)假設檢定(test of hypothesis) 對母體參數作出一適當的假設,然後根據隨機抽樣 之樣本,利用樣本統計量之抽樣分配來決定接受或 拒絕假設的過程。 (二)統計假設(statistical hypothesis) 對一個或多個母體參數的一個推測。
2. 假設檢定之基本概念(2) 例題 1 • 以下為幾個統計假設的例子: • (1)中華沙拉油的平均容量大於3公升。 • (2)台灣電腦公司所生產的電腦之不良率小於0.1。 • (3)福特汽車公司所生產的Tierra與Mondeo汽車具有相同的 • 汽車耗油率。 • (4)消費者對於某餐廳服務品質之期望與認知沒有差異(即 • 無服務品質缺口)。 • (5)不同年齡層之民眾對網路電話使用意願具有差異性。 • 上述五個敘述中,前兩個敘述為對單一母體參數之推測, • 後三個敘述為二個或二個以上推測,均可稱為統計假設。
2. 假設檢定的概念(3) • 有兩個假設。一個被稱為虛無假設,另一個被稱為對立或研究假設。通用的符號表示法: H0: — 「虛無假設」 H1: — 「對立」或「研究假設」 • (1)虛無假設(null hypothesis):通常為研究者欲推翻之統計假 設,即假設檢定中之主要假設,一般以 H0 表之。 • (2)對立假設(alternative hypothesis): 假設虛無假設不成立,即虛無假設之互補假設,一般以 H1 表之。
2. 假設檢定之基本概念(4) 例題 2 • 某手機業者宣稱其手機之平均待機時間為96小時,請問消費 • 者欲檢定此手機業者之宣稱是否為真,請問該如何假設? 解 依檢定的動機可假設如下:(令 表平均待機時間) 虛無假設 :平均待機時間大於或等於96小時。 即。 對立假設 :平均待機時間小於96小時。 即。
2. 假設檢定之基本概念(5) • 根據樣本統計量所定訂拒絕 範圍的不同,可將假設檢 • 定的形式分成以下兩種: • (1)單尾檢定(one-tailed tests): • 當樣本統計量僅在大於某個數值或小於某個數值之其 • 中一種情形之下拒絕 之檢定。若拒絕 為樣本統 • 計量大於某個數值時,則此單尾檢定又稱右尾檢定, • 反之若小於某個數值時,則稱左尾檢定。 • (2)雙尾檢定(two-tailed tests): • 當樣本統計量大於某個數值或小於某個數值均可能拒 • 絕 之檢定。
2. 假設檢定之基本概念(6) 例題 3 • (1) ; • (2) ; • (3) 。 • 請問上述何者為單尾檢定之假設,何者為雙尾檢定之假 • 設? 解 依樣本統計量拒絕 之範圍可知(1)及(3)為單尾檢定之假設且(1)為左尾檢定之假設;(3)為右尾檢定之假設;(2)為雙尾檢定之假設。
2. 假設檢定之基本概念(7) 圖 1 拒絕虛無假設的範圍稱之為危險域或拒絕域(critical region)。 以 為例:若訂定拒絕域為 ,其拒絕域與接受域之範圍如下所示:
2. 假設檢定之基本概念(8) 右尾檢定 左尾檢定
2. 假設檢定之基本概念(10) -錯誤的型態 • (三)型 I 錯誤 • 當虛無假設 為真而拒絕 ,稱之為型 I 錯誤。 • 造成型 I 錯誤的機率以α表示,定義如下: • α又稱為顯著水準(significance level),為容許犯型I 錯誤的最大機率 • (四)型 II 錯誤 • 當虛無假設 非真而接受 ,稱之為型 II 錯誤。 • 造成型 II 錯誤的機率以 表示,定義如下: • 稱為檢定力 (power of the test)
2. 假設檢定之基本概念(11)-錯誤的型態 型 I錯誤(Type I error) 發生於當我們拒絕了一個真實的虛無假設。 型 II 錯誤(Type II error) 發生於當我們不拒絕一個錯誤的虛無假設(例,沒有拒絕 H0,當它是錯誤的)。
2. 假設檢定之基本概念(12) 例題 4 • 一常態母體之變異數為5,今對此母體平均數作以下之假設, ,並決定其拒絕域為 。 • 請問以樣本個數為20之一組樣本所得之樣本平均數來檢定 • 母體平均數所造成之型 I 錯誤之機率, 值為何? 解
2. 假設檢定之基本概念(13) 例題 5 • 承例 4,若 時,求造成型II 錯誤之機率 值。 解
2. 假設檢定之基本概念(14) 例題 6 • 承例4,若拒絕域改為 ,求 值及 值。 解
2. 假設檢定之基本概念(16) • 檢定統計假設的兩種方法如下: • (1) 臨界值法(critical value method): • 給定顯著水準α值,然後決定拒絕域後,再依所得之樣本,計算其樣本之統計量(即為檢定值),最後再判定上述檢定值是否落在拒絕域中。 • (2) P值法(P-value method): • 在 為真的條件下,計算由給定之樣本導致拒絕 的最大機率。不論是單尾或雙尾檢定,若P 值小於α值,則拒絕虛無假設 ,否則便勉強接受 。
2. 假設檢定之基本概念(17) 圖 3
2. 假設檢定之基本概念(18) (五) 假設檢定步驟 (1)建立假設(虛無假設與對立假設)。 (2)選擇檢定之統計量,並給定顯著水準α值。 (3)決定檢定方法(臨界值法或P值法),若選擇臨界值 法,則決定拒絕域。 (4)蒐集樣本並計算檢定值。 (5)下結論: 臨界值法: 若檢定值落在拒絕域,則拒絕 ,否則便接受 。 P值法: 計算P 值,若P 值小於 ,則拒絕 ,否則便接受 。
3. 單一母體平均數之假設檢定(1) (一)常態母體且 已知 以 為檢定值,其拒絕域與P值如下: (1)左尾檢定: 之拒絕域為 (2)右尾檢定: 之拒絕域為 (3)雙尾檢定: 之拒絕域為
3. 單一母體平均數之假設檢定(2) 例題 7 • 某一廠商產品重量之標準差為5公克。今此廠商宣稱其產品的平均重量恰為250公克,若隨機由該公司抽取16件產品秤其重量,得其平均數為246公克,請以顯著水準 檢定此廠商宣稱是否為真?(假設母體具常態分配) 解 方法一:臨界值法 step 1 : step 2 :因為 且 , 。以 為檢定之統計量,且顯著水準為
3. 單一母體平均數之假設檢定(3) 解 • step 3 :其拒絕域為 • step 4 :檢定值 • step 5 :結論,拒絕 ,即此廠商宣稱非真。
3. 單一母體平均數之假設檢定(4) 解 方法二:P 值法 step 1 與 step 2 同上。 step 3 : step 4 : step 5 :結論,拒絕 ,即此廠商宣稱非真。
3. 單一母體平均數之假設檢定(5 ) (二)常態母體且 未知,大樣本 以 為檢定值,其拒絕域與P值如下: (1)左尾檢定: 之拒絕域為 (2)右尾檢定: 之拒絕域為 (3)雙尾檢定: 之拒絕域為
3. 單一母體平均數之假設檢定(6) 例題 8 • 某個工廠過去所生產之產品平均重量為25公斤,標準差4公斤,今隨機抽取該工廠產品49件作檢查,得其平均重量為27公斤,請問假設在標準差未改變條件下,該工廠產品之重量是否有明顯地改變? 解 假設 ,由於隨機樣本之樣本個數49 可視為大樣本,其檢定統計量 , 拒絕域為 而檢定值 落在拒絕域中,因此拒絕 ,即此工廠產品之平均重量已有顯著地改變 。
3. 單一母體平均數之假設檢定(7) (三)常態母體且 未知,小樣本 以 為檢定值,則其拒絕域與P值如下: (1)左尾檢定: 之拒絕域為 (2)右尾檢定: 之拒絕域為 (3)雙尾檢定: 之拒絕域為
3. 單一母體平均數之假設檢定(8) 例題 9 • 某一廠牌行動電話宣稱其平均重量不超過78公克,今隨機抽 • 取此廠牌行動電話10支,得其平均重80公克,標準差4公克。請以顯著水準 來檢定此廠商宣稱是否為真?(假設母體具常態分配) 解 依題意,可建立假設為 由於隨機樣本之個數10為小樣本,其檢定統計量 ,拒絕域為檢定值 ∴不落在拒絕域中,因此勉強接受此廠商之宣稱平均重量不超過78公克 。
3. 單一母體平均數之假設檢定(9) 例題 10 • 承例9,若以顯著水準 來檢定此廠商宣稱,結果為何? 解 拒絕域為 而檢定值 落在拒絕域, 因此拒絕廠商之宣稱。
3. 單一母體平均數之假設檢定(10) 例題 11 • 承例9,若蒐集之隨機樣本為100個,請問在樣本平均數與變異數不變之條件下,以 來檢定廠商之宣稱,結果為何? 解 由於當n=100時, 其拒絕域為 而檢定值 落在拒絕域中, 因此拒絕此廠商之宣稱。
4. 假設檢定與信賴區間之相關性(1) 信賴區間之假設檢定決策法則 在常態母體且 已知之條件下,若 為隨機樣本 之平均數且顯著水準為 ,則雙尾 檢定: 之決策法則如下:
4. 假設檢定與信賴區間之相關性(2) 例題 12 • 某個工廠過去所生產之產品平均重量為25公斤,標準差4公斤,今隨機抽取該工廠產品49件作檢查,得其平均重量為27公斤,請問假設在標準差未改變條件下,該工廠產品之重量是否有明顯地改變? • 請以信賴區間之決策法則重作本題 解 假設 ,由於隨機樣本之樣本個數49 可視為大樣本,其檢定統計量 , 拒絕域為 而檢定值 落在拒絕域中,因此拒絕 ,即此工廠產品之平均重量已有顯著地改變 。
4.假設檢定與信賴區間之相關性(2/2) 例題 12 • 某個工廠過去生產產品平均重量為25公斤,標準差4公斤,今隨機抽取該工廠產品49件作檢查,得平均重量為27公斤,請問假設在標準差未改變條件下,該工廠產品之重量是否有明顯地改變?請以信賴區間之決策法則重作本題 • 請以信賴區間之決策法則重作例11.11。 解 假設 為雙尾檢定形式,已知顯著水準 ,因此平均數之95%之信賴區間為 未包含 ,由此可知其結果與原作法結果相同,拒絕 。
5. 單一母體比例值之假設檢定(1) (一)單一母體比例值假設檢定之決策法則 若隨機變數X具有二項分配 ,令 表 次試驗中 事件成功之次數,則以 為檢定值,其母體比例值 p值假設檢定之決策法則如下: (1)左尾檢定: 決策法則之P值 (2)右尾檢定: 決策法則之P值 (3)雙尾檢定: 決策法則之P值
5. 單一母體比例值之假設檢定(2) 例題 13 • 若某公司宣稱其產品不良率不高於10%,今隨機抽取該公司產品20件,發現有 3 件不良品,請問在顯著水準0.05條件下,此公司之宣稱是否為真? 解 依題意,可建立假設(p表產品不良率) 計算決策法則之P值如下: 無法拒絕 ,即沒有充分的理由推翻此公司之宣稱。
5. 單一母體比例值之假設檢定(3) (二)大樣本時之決策法則 若隨機變數 具有二項分配 ,令 表 次試 驗中事件成功之次數,則以 為檢定值 ,其母體比例值 p值假設檢定之決策法則如下: (1)左尾檢定: 之拒絕域為 (2)右尾檢定: 之拒絕域為 (3)雙尾檢定: 之拒絕域為
5. 單一母體比例值之假設檢定(4) 例題 14 • 若某候選人宣稱其支持度至少為30%,今隨機抽取100位該選區之選民作調查,發現支持此候選人者有25位,請以顯著水準 來檢定此候選人之宣稱是否正確? 解 依題意,可建立假設(p表候選人之支持度) 以Z值作為檢定之統計量,其拒絕域為 而抽樣所得之檢定值 不落在拒絕域中,因此勉強接受此候選人之宣稱。