510 likes | 914 Views
CHAPTER 10 假設檢定. 基礎統計學 STATISTICS FOR MANAGEMENT AND ECONOMICS. 目錄. 10.1 導論 10.2 假設檢定的概念 10.3 母體平均數的檢定-當母體標準差已知 10.4 計算型 II 誤差的機率 10.5 未來課題. 10.1 導論. 假設檢定,其目的其為判斷是否存在足夠的統計證據來對母體參數的假設進行合理的推論 假設檢定應用的例子如下: 應用 1 檢定購買此產品的比例是否大於 12% 應用 2 檢定宣稱的療效,以推論新藥是否有效 應用 3 用在評估這些模式的好壞.
E N D
CHAPTER 10假設檢定 基礎統計學 STATISTICS FOR MANAGEMENT AND ECONOMICS
目錄 10.1 導論 10.2 假設檢定的概念 10.3 母體平均數的檢定-當母體標準差已知 10.4 計算型II誤差的機率 10.5 未來課題
10.1 導論 • 假設檢定,其目的其為判斷是否存在足夠的統計證據來對母體參數的假設進行合理的推論 • 假設檢定應用的例子如下: • 應用1 • 檢定購買此產品的比例是否大於12% • 應用2 • 檢定宣稱的療效,以推論新藥是否有效 • 應用3 • 用在評估這些模式的好壞
10.2 假設檢定的概念 • 罪犯審判 • 實際有二個假設會被檢定 • 虛無假設(null hypothesis) ,以符號 H0 表示,即: H0 :被告無罪 • 對立假設(alternative or research hypothesis),以符號H1表示,在罪犯審判時,即: H1 :被告有罪
10.2 假設檢定的概念 • 假設檢定可能會出現兩種誤差 • 型I誤差(Type I error) :當我們拒絕一個真的虛無假設時 • 型I誤差以 表示稱為顯著水準 (significance level) • 型II誤差(Type II error) :定義為沒有拒絕一個假的虛無假設 • 以 (beta) 表示 • 及 之間為反方向的變動關係
10.2 假設檢定的概念 • 假設檢定具有下列重要的概念: • 包含兩個假設,一個是虛無假設(H0 );另一個是對立假設(H1 ) • 在檢定的過程中,先假定虛無假設為真 • 進行檢定的目的,是要決定是否有足夠的證據推論對立假設為真 • 檢定有下列二種可能的結果: • 拒絕虛無假設,支持對立假設 • 不拒絕虛無假設,沒有足夠的證據來支持對立假設
10.2 假設檢定的概念 • 任何檢定都會發生兩種可能誤差,其機率式可以寫為: P (Type I error) P ( 拒絕H0 ,當H0為真) P (Type II error) P ( 不拒絕H0 ,當H0為偽)
10.3 母體平均數的檢定 - 當母體標準差已知 • 例題10.1 百貨公司經理想針對信用簽帳的顧客建立一套新的帳戶處理系統。經過完整的財務分析,她判斷只有在全部帳戶的平均月消費額超過$170時,新系統才會有成本效益。因此她隨機抽出400個帳戶( 資料儲存在XM10-01),得到樣本平均數為$178,假設經理已知帳戶月消費額符合常態分配,且標準差為$65,該經理是否可由此推論新系統具有成本效益?
統計方法確認 設立對立假設為: 虛無假設為: 要檢定這個問題有兩種方式 • 拒絕域法 (rejection region method) • p值法 (p-value approach)
可以拒絕虛無假設的樣本平均數值為 ,則拒絕域為: 10.3.1 拒絕域法
筆算作答 已知 及 ,因為上述所有機率都是建立在虛無假設為真的條件上,所以 。計算拒絕域需要 值,假設該經理選擇顯著水準() 為5%,則 ,我們可以求出 的值 10.3.1 拒絕域法
因此拒絕域為: 已知檢定統計量的樣本平均數是178,因為178大於175.35落在拒絕域內,所以拒絕虛無假設。因此,有足夠的證據推論月平均帳戶消費額大於170 前述的計算告訴我們,從 = 170的母體中,相當不易得到樣本平均數 大於175.35的抽樣。也因此讓我們有信心推論假設虛無假設為真是不正確的,應該拒絕虛無假設。
10.3.2 標準化檢定統計量 • 另一種較簡單的方法是將 標準化後的值作為檢定統計量 • 標準化檢定統計量 (standardized test statistic): • 拒絕域可為: • 假設:
因為2.46大於1.645,所以拒絕虛無假設。有足夠的證據推論月平均帳戶消費額大於$170因為2.46大於1.645,所以拒絕虛無假設。有足夠的證據推論月平均帳戶消費額大於$170 10.3.2 標準化檢定統計量
在例題10.1中,p值是當母體平均數為170時,觀察樣本平均數至少比178大的機率。即:在例題10.1中,p值是當母體平均數為170時,觀察樣本平均數至少比178大的機率。即: p值法(p-value Method)
p值法(p-value Method) 因為 p 值 0.0069 < 0.05,代表 p 值足夠小到拒絕虛無假設
p值的解釋 • 當母體平均數是170時,觀察樣本平均數比178大的機率相當的小,其為0.0069 • 換句話說,觀察樣本平均數計算所得到的p值,此結果對於母體平均數是170的假設支持很小,因此,我們應懷疑虛無假設中對母體平均數的假設,所以應拒絕虛無假設而支持對立假設
10.3.5 描述 p 值 • 統計學家通常使用下列的描述來解釋 p 值 • 若 p 值小於1%,有充分證據來推論對立假設為真,亦即該檢定為高度顯著 • 若 p 值介於1% 及5% 之間,有相當強的證據推論對立假設為真,亦即該檢定為顯著 • 若 p 值介於5% 及10% 之間,有薄弱證據顯示對立假設為真,當 p 值大於5%,該檢定在統計上不顯著 • 當 p 值大於10%,沒有足夠的證據來推論對立假設為真
例題10.2 某政府單位負責督導食物製造商以確保其包裝內容物的重量或數量,符合標籤所標示的內容。例如某品牌瓶裝蕃茄醬標籤標示內容物淨重為16盎司,所以內容物必須至少淨重16盎司。要抽檢全國該品牌所有的瓶裝蕃茄醬是不可能的,因此該單位必須使用統計方法。該單位的做法是隨機由該產品中選取一組樣本,並測量其內容物重量,若該樣本平均數提供充分的證據足以推論所有瓶裝的平均重量少於16盎司,則該產品的標示正確性不可接受。下列數據是一政府檢查員測量25瓶標示淨重“16盎司”的蕃茄醬所得到的數據 ( 資料儲存在延續例題10.2 檔案XM10-02中 ),從先前的實驗中檢查員已知蕃茄醬瓶裝重量為一標準差 = 0.4 盎司的常態分配,則檢查員可否推論該產品標示不可接受?
統計方法確認 本研究目的是要對所有瓶裝蕃茄醬的平均重量作推論,因此要檢定母體平均數 。檢查員想知道是否有足夠的統計證據顯示母體平均數少於16盎司。因此,對立假設為: 則虛無假設自然為: 檢定統計量為:
筆算作答 筆算作答解答本問題,我們需定義拒絕域,所以選擇顯著水準 = 0.05。 只有當檢定統計量的值足夠小,我們才拒絕虛無假設,所以拒絕域放在抽樣分配的左尾。為什麼呢?記住我們是要決定是否有足夠的統計證據推論平均數小於16盎司 ( 即對立假設 ),但若我們觀察到一個較大的樣本平均數 ( 或一個較大的z值 ),我們是否會拒絕虛無假設?答案絕對為否定的。例如說樣本平均數是20卻推論所有瓶裝的平均重量小於16盎司是非常荒謬的。所以只有當樣本平均數 ( 或z值 ) 為小時,我們才拒絕虛無假設。但問題是“到底要到多小”才足夠?答案是依顯著水準及拒絕域而定。因此本題拒絕域設定為:
注意上述不等式的方向與對立假設 ( 16) 之不等式一致。另因為拒絕域在抽樣分配的左邊 ( 包含小於 0 的 z 值 ) 所以為負號。代入資料得到樣本平均數: 母體標準差 = 0.4 為已知,n = 25,而 假設為16,經計算得到檢定統計量的值為:
因其大於 1.645,故不拒絕虛無假設,即沒有足夠的證據推論母體平均數小於16盎司。另外檢定的 p值為: 也因為 p 值大於 值,故不拒絕虛無假設。 在此類型的假設檢定中,我們計算 P (Z < z) 的機率p值,z為檢定統計量的實際值。圖10.7中描繪出抽樣分配,拒絕域及 p 值。
結果解釋 因為無法拒絕虛無假設,我們可以說沒有足夠證據推論母體平均數小於16盎司。必需注意本例中仍有些證據指出母體平均數小於16盎司,因為我們計算出樣本平均數為15.9。無論如何,要拒絕虛無假設就必需要有足夠的理由來拒絕虛無假設。在缺乏足夠證據顯示所有瓶裝蕃茄醬平均重量小於16盎司,檢查員無法斷言標籤標示為不正確的。
例題10.3 自從啟用新的製程以來,負責組裝電腦鍵盤生產線的主管陸續遇到一些問題。他注意到瑕疵品及偶發性停滯的情形增加,某一工作站的產出量不能配合其他工作站的產出量。在檢視製程後,發現當初是以完成關鍵零組件所需的時間平均數130秒、標準差15秒、且為一常態分配為假設的前題下,設計出該製程。他相信製程時間是標準差15秒的常態分配,但不確定平均組裝時間為130秒。為了確認應否調整生產線,他隨機測量了100次組裝時間 ( 資料存於在檔案XM10-03中 ),結果列示於下,請問主管能否推論生產線平均組裝時間為130秒的假設是不正確的?
統計方法確認 在本例題中,我們想知道平均組裝時間是否不同於130秒。因此設立對立假設為: 虛無假設則為:
筆算作答 因為當檢定統計量足夠大或足夠小時,便拒絕虛無假設。因此拒絕域分別在抽樣分配的左、右尾上,我們需設立一雙尾拒絕域(two-tail rejection region)。拒絕域總面積 需除以2,得到拒絕域範圍為: 因 = 0.05 , /2 = 0.025 ,及 za /2 = z0.025 = 1.96 則拒絕域為: 計算樣本資料得到:
檢定統計量為: 因 2.13小於 1.96所以拒絕虛無假設。 我們也可計算該檢定的 p 值,因其為雙尾檢定,可分別找出雙尾的面積,則: 或簡單的把單尾的機率乘以2即可。
通常,雙尾檢定的 p 值可以寫成: Z 表檢定統計量計算出的實際值,|z|為該數字的絕對值,圖10.8展示出檢定統計量的抽樣分配。
結果解釋 有證據推論平均組裝時間不等於130秒,生產作業經理在決定如何進行下一步之前需先考慮幾個因素,首先是平均時間有多大的可能不是130秒,雖然 p 值顯示出是有統計證據存在,但並非是不容置疑的證據,第二個課題是不良品增加及瓶頸問題可能是其他原因造成的,第三個課題是就算從製程中找到問題,也可能因成本效益或不可行而無法更正製程。但很清楚的是我們需要更多的調查,因此統計分析至少讓經理開始尋找出一解決方案。
10.3.7 假設檢定與區間估計 • 檢定統計量及區間估計量皆由抽樣分配求出。因此可以利用區間估計量來檢定假設並不意外 • 信賴區間的估計值為: • 在例題10.1中,95% 信賴區間估計值為LCL=171.63 及UCL= 184.37,未包含170在其中,所以我們下結論說母體平均數不等於170
10.4 計算型II誤差的機率 • 回想例題10.1,我們以樣本平均數當作檢定統計量,當得到拒絕域為: 若 小於 $175.35我們便不會拒絕虛無假設,也不會安裝新的帳戶處理系統。因此例中的型II誤差發生在當新帳戶系統有成本效益而我們並未予以安裝。這種發生的機率便是型II誤差的機率,被定義為:
10.4 計算型II誤差的機率 • 假設實際的平均帳戶消費額至少為$180時,裝設新系統可以節省許多費用,即當實際的 ,不是$170時,不裝設新系統的機率,也就是型II誤差的機率為: 當平均帳戶消費額實際為 $180時,卻不拒絕虛無假設的機率為0.0764,也就是會推論母體平均數等於 $170的機率
10.4.1 改變α對β的影響 • 假設上例我們以顯著水準1% 取代5% 未標準化的檢定統計量則為: 當 時,型II誤差機率為:
10.4.1 改變α對β的影響 比較圖10.9與圖10.10,你可以看到降低顯著水準從5% 到1%,則拒絕域的臨界值會向右邊移動,不拒絕虛無假設的區域加大,型II誤差的機率也從0.0764增加到0.2296
10.4.3 大樣本意謂更多的資訊,更好的決策 • 計算n = 400及n = 1,000 時的型II誤差發生機率,告訴我們一個特別重要的觀念,增加樣本大小可以降低型II誤差的機率,藉著降低型II誤差的機率我們便不易犯下會犯的錯誤
10.4.4 檢定力 • 另一種衡量檢定好壞的方法是檢定力(power)-即當虛無假設不為真時,讓我們拒絕虛無假設的機率即為檢定力。因此檢定力為1-β
10.5 未來課題 • 在後續的章節中,我們將介紹多種常被決策者所採用的統計方法。統計方法學習的主要關鍵是知道使用那個公式來進行計算或選用那一組指令於軟體進行操作,但應用時,真正的挑戰會是如何定義問題及選擇那一種統計方法最恰當
10.5.3 公式彙整 • 檢定統計量 • 檢定的p值 • 型II誤差的機率