440 likes | 1.18k Views
中央極限定理. 是指不論 母體為何種分配型態 ,只要抽取之樣本數 n ≥ 30 ,樣本均值 的抽樣分配將趨近於常態分配,即: p.259. 舉例. 母體分配 母體分配. 中央極限定理. 抽樣 分配 抽樣 分配. 中央極限定理 (續). 抽樣分配 抽樣分配. 中央極限定理 (續). 常態分配之概念. 連續性隨機變數 X 具有下列的機率密度函數: 上述機率密度函數稱為常態分配。 一般以 N( μ , σ 2 ) 表示之. 標準常態分配.
E N D
中央極限定理 • 是指不論母體為何種分配型態,只要抽取之樣本數n ≥ 30,樣本均值 的抽樣分配將趨近於常態分配,即:p.259
舉例 母體分配 母體分配 中央極限定理
抽樣分配 抽樣分配 中央極限定理(續)
抽樣分配 抽樣分配 中央極限定理(續)
常態分配之概念 • 連續性隨機變數X具有下列的機率密度函數:上述機率密度函數稱為常態分配。 • 一般以N(μ,σ2)表示之
標準常態分配 • 有鑑於常態分配求算機率值殊為不易,統計學家便將之標準化,使各種不同的常態分配,皆能轉換為標準常態分配, 透過查表即可求得機率值。標準化的方法如下:x value z value • 轉換後 μ=0 σ=1
標準常態分配(Standard Normal Distribution): • 即平均數為0,標準差為1的常態分配。 • 機率密度函數: • 標準化(Normalized):
t 分佈 • 常態分佈的母體或符合中央極限定理的條件下,必須知道母體的變異數σ,抽樣分佈N(μ,σ2/n)才可以轉換成標準常態分佈 • N(0,1)或z分佈,其過程和特性如前節所述。正常情況下,通常是不知道母體的變異數σ,但可以經由抽樣得到樣本的變異數S2 • 原來在Z分佈中 • 此時在不知母體的變異數σ 改成
t 分配 • t分配是由William S. Gossett在1908年以筆名Student所發表的,故而又稱之為Student t分配。這是一個對稱的分配,基本假設為樣本自常態分配的母體中抽取,而後綜合標準常態分配與卡方分配推導求出。
t分佈不是固定形狀,會隨自由度而改變 自由度 df = n-1 自由度小時樣本標準誤差大,t分佈形狀較矮胖,隨著自由度的增加,t分佈的形狀越來越高,也越接近z分佈。 大樣本(n>30) 時,t分佈視為z分佈。 隨機變數t與其對應的機率函數值α列於附錄6,p.722
區間估計與假設檢定的關係 • 做區間估計時,信賴水準(1-α)是研究者選定的設定值,如果已知抽樣分佈,信賴區間的大小是依據信賴水準的大小決定,信賴區間的最大值稱為信賴上界(upper confidence limit,U)或上限,最小值則稱為信賴下界(lower confidence limit,L)或下限。又稱稱臨界值(critical values)
樣本大小為36,故為大樣本,所以 的抽樣分配為常態分配。 信賴區間=1-α =0.95,α/2=0.025, 0.95 μ 抽樣誤差 某保險公司自其投保人的母體中隨機抽出36位投保人,計算出此36位投保人的平均年齡為 =39.58歲,已知母體標準差為σ=7.2歲,試求出母體平均數μ的95%信賴區間。 P(-zα/2<z<zα/2)=0.95 投保人的年齡95%信賴區間為 (37.15, 41.85)
假說檢定之基本概念 • 所謂假說檢定是在尚未進行推論之前先對母體的某種性質做一假說性的敘述,再利用樣本及抽樣分配所呈現的訊息,加以檢驗此假說是否為真。 • 進行假說檢定時,必須開列兩個假說:研究者所欲否定、放棄者,稱之為虛無假說,以H0表示。另外一個是與虛無假說對立、互斥,即恰為其反面者,稱之為對立假說,以H1表示。
假設檢定(Hypothesis Testing) • 是對母體參數(特性)提出假設(或主張),利用樣本的訊息,決定接受該假設或拒絕該假設的統計方法。 • 虛無假設 (Null Hypothesis) • 對立假設 (Alternative Hypothesis) • 基本精神︰ • 除非具有足夠的證據可以否決 ,否則我們只好接受 ;但是接受 並不表示 為真,僅表示我們沒有足夠的證據可以拒絕 ;相對的,拒絕 時僅表示我們具有充分的證據可以拒絕 ,此時此檢定稱為具顯著性(Significance)。 • 統計假設檢定亦稱為顯著性檢定(Significant Testing)。
假說開列例子 p.307 L20 • P.308 ex9.1-1 • 假說開列 進行檢定 • 以虛無假說為檢定對象 尋找足夠證據否定虛無假說
P.308 ex9.1-1 試就下列各情況開列應有之假說: (1)一工廠宣稱其出品的葡萄果汁含糖量顯著低於1克/公升。 ANS : μ=葡萄果汁含糖量 (克/公升) H0 :μ≧ 1 H1 :μ<1
(2)由一大箱燈泡中隨機抽取20個,發現平均壽命為800小時,標準差為250小時,而研究人員欲檢定燈泡的平均壽命是否顯著大於850小時。(2)由一大箱燈泡中隨機抽取20個,發現平均壽命為800小時,標準差為250小時,而研究人員欲檢定燈泡的平均壽命是否顯著大於850小時。 ANS :μ=燈泡的平均壽命(小時) H0 :μ≦ 850 H1 :μ >850
(3)一私立中學想調查該校學生平均每月的零用錢是否顯著高於2000元。(3)一私立中學想調查該校學生平均每月的零用錢是否顯著高於2000元。 ANS :μ=零用錢(元) H0 :μ≦ 2000 H1 :μ >2000
定義 1. α是拒絕虛無假設H0時會發生錯誤的機率,稱為顯著水準(level of significance)。 2. β是拒絕對立假設H1時會發生錯誤的機率。 信賴水準(1-α)是研究者選定的設定值
雙尾檢定與單尾檢定 • 雙尾檢定的假說形式 • 單尾檢定 • 左尾檢定的假說形式 • 右尾檢定的假說形式
P.313 ex9.4-1 飲料公司想推出一款新的飲料,為了了解飲料甜度是否適中,進行了一項口味測試,希望能調製出甜度恰到好處的飲料。測試方法乃請受訪者試喝,並用李克特(Likert)良表衡量甜度感受,量表刻度如下表所示。經受訪者試喝後勾選,答非常淡者得-2分,答有點淡者得-1分,以此類推。 試對下列各情況開列應有之假說: (1)公司想要了解飲料甜度是否適中。 (2)公司想要了解飲料甜度是否太淡。 (3)公司想要了解飲料甜度試否太甜。
雙尾檢定與單尾檢定(續) • 假說檢定所需要的四步驟說明如下: • 開列假說 • 決定棄卻區 先設立棄卻區顯著水準α • 計算檢定統計量 • 制定決策
P.317 ex5.1 教務主任宣稱,該校三年級學生此次數學期中考平均有78分。今隨機抽取36人,結果發現數學成績為75分,標準差為12分。在α=0.05的情況下,該教務主任的宣稱是否屬實? ANS :μ=數學期中考平均(分) H0 :μ ≠ 78 (μ0) H1 :μ =78 α/2=0.025 σ=12 n=36 查表 臨界值 z0=1.96 z= (75-78)/(12/√36) =-1.5 -1.96<-1.5<1.96 抽樣值介於接受區 所以教務主任的宣稱屬實 0
P.319 ex.5.2 根據一項兩年前的普查,台灣地區家庭平均人口數為3.8人。今隨機抽取900個家庭調查發現平均人口數為3.5人,標準差為0.7人。在α=0.01的情況下,研究者可否宣稱現在的家庭人口數較兩年前少? ANS :μ=家庭平均人口數(人) H0 :μ ≧ 3.8 (μ0) H1 :μ <3.8 α=0.01 σ=0.7 n=900 查表 臨界值 z0= z= (3.5-3.8)/(0.7/√900) = 抽樣值介於接受區????? 所以研究者的宣稱屬實????
區間估計與假說檢定之關係 • 區間估計與假說檢定皆是以樣本統計量的抽樣分配為基礎,進行母體推論的工作。 • 如果虛無假說所宣稱的母體參數值落於信賴區間內,則表示有 %的信心,可宣稱母體均值會落於信賴區間內,故不能棄卻。反之,若虛無假說所宣稱的母體均值不在信賴區間內,則應該棄卻H0。
平均數的區間估計值-----t分佈 • 同理可得
承例9.5-1,樣本數為36人,平均成績為75分,標準差為12分。試以區間估計的方法判定該教務主任的宣稱是否屬實。承例9.5-1,樣本數為36人,平均成績為75分,標準差為12分。試以區間估計的方法判定該教務主任的宣稱是否屬實。 Ans: n = 36 σ=12 μ= 75 ± 1.96 × 12/√36 =75 ± 3.92 =(71.08 ,78.92)
設某工廠出品的檸檬汽水,其容量呈現常態分配,標準差為1.5ml。今自其中隨機抽取20罐,發現其平均容量為248ml,則所有汽水平均容量的99%信賴區間為何?設某工廠出品的檸檬汽水,其容量呈現常態分配,標準差為1.5ml。今自其中隨機抽取20罐,發現其平均容量為248ml,則所有汽水平均容量的99%信賴區間為何? Ans n=20 x = 1.5 σ=1.5 z0.01/2 = μ= 1.5 ± × 1.5/√20 =1.5 ± =( , )
假定自某次統計學考試的考生中隨機抽取8人,其成績如下所示:68 92 73 85 77 50 95 76若全班成績呈現常態分配,是求全班平均成績的95 %信賴區間。 Ans n = 8 x = s = μ= x ± t0.05/2 × s /√8 = ± × /√8 = ± =( , )
例4-1 p.73 • 用動物實驗做實驗材料,要求動物平均體重μ=10.00公克,若μ﹤10.00公克再飼養,若μ﹥10.00公克應淘汰。動物體重服從常態分配N(μ,σ2)的隨機變數。已知母體標準差σ=0.40g,但母體平均數μ未知。為了得出對母體平均數μ的推定,從動物母體中,隨機抽取樣本數為n的樣本,運用樣本平均數x推定母體平均數μ。
例4-2 p.76 • 從例4-1的動物母體中,抽出樣本數n=10的樣本,並已計算出樣本平均數x=10.23公克。 • 虛無假設H0:μ ≦ 10.00公克。 • 已知這批動物實驗飼養的時間,比根據以往經驗所需飼養的時間長很多,因此μ不可能小於μ0(10.00公克),所以 • 對立假設HA:μ﹥10.00(公克)。規定顯著性水準α=0.05。 • Ans:求出Z值 由樣本計算出的Z=1.82 • Z=從常態分配表中,可以查出 P(Z>1.82)=0.03438 ,P<0.05,該樣本幾乎不可能抽出μ ≦ 10.00(公克)的母體,從而拒絕H0而接受HA。即所抽出樣本的母體平均數並不等於10.00公克,而未知母體的平均數是大於10.00公克的某個值。 • 在實際應用時,在本例中規定顯著性水準α=0.05,可以查出Z0.05=1.645。,Z>Zα,Z落在H0的拒絕域之內,從而拒絕H0而接受HA。
例題4-3 p.79 • 從例4-1的動物群體中,抽出n=10的樣本,樣本平均數x=10.20公克, • 檢驗H0:μ≦10.00公克, HA:μ﹥10.00公克 • 一般的做法是由計算標準化的樣本平均數做推定。 • Z= ,Z0.05=1.645,Z<Z0.05,Z落在接受域之內。 • 結論是接受H0:μ ≦ 10.00公克
單樣本顯著性檢定的基本程式歸納如下: • (1)假設:虛無假設是假設檢定的基礎。它可能有以幾個來源:1.根據以往的經驗或者是根據某些實驗結果;2.依據某種理論或某種模型;3.根據預先所做的某種規定而提出來的。例4-1的虛假設就是依據預先所做的規定提出來的。 • 對立假設是母體母數除去虛無假設以外的某些值。它可能有以下幾個來源:1.除了虛無假設以外可能的值;2.擔心會出現的值;3.希望出現的值;4.有重要實際意義或其他意義的值。 • (2)顯著性水準:根據問題的要求規定顯著性水準,對於實驗條件不易控制或容易產生較大誤差的實驗,如一些生化實驗,可以將α定地寬一些,如α=0.10;對於容易產生嚴重後果的一些實驗,如藥物的毒性實驗α可以定地嚴一些,α=0.01。