1 / 42

第 7 章

第 7 章. 抽樣與抽樣分配 Part B (7.6-7.8). 抽樣與抽樣分配 Part B. 7.6 的抽樣分配 7.7 點估計量的性質 7.8 其他抽樣方法. 第 7 章抽樣與抽樣分配 Part B (7.6-7.8) 第 253 頁. 7.6 的抽樣分配. 母體比例 統計推論的過程. 母體比例 p = ?. 從母體抽取 n 個元素 為一簡單隨機樣本. 用 值 推論 μ 值. 用樣本資料計算 母體比例.

Download Presentation

第 7 章

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第 7 章 抽樣與抽樣分配 Part B (7.6-7.8)

  2. 抽樣與抽樣分配 Part B • 7.6 的抽樣分配 • 7.7 點估計量的性質 • 7.8其他抽樣方法 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第253頁

  3. 7.6 的抽樣分配 • 母體比例 統計推論的過程 母體比例 p = ? 從母體抽取 n個元素 為一簡單隨機樣本 用 值 推論μ值 用樣本資料計算 母體比例 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第273頁

  4. 的抽樣分配 • 的抽樣分配是所有樣本比例  值的機率分配。 • 的期望值 其中: p =母體比例 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁

  5. 的抽樣分配 • 在 7.1 節中,我們提到 EAI 母體的比例 p=0.60,此 p值為完成管理訓練課程的主管的比例,因此 EAI 抽樣問題中, 的期望值為0.60。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁

  6. 的抽樣分配  的期望值 無限母體 有限母體 是母體的標準誤 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第274頁

  7. 的抽樣分配 • 一般而言,我們使用標準誤來表示點估計量的標準差,因此,也用比例的標準誤表示 的標準差。 • 回到 EAI 的例子,以 30 位主管的簡單隨機樣本,求其樣本比例的標準誤。在 EAI 一例中,參加管理課程的主管的比例為 p=0.60,由於 n/N= 30/2500 = 0.012,故計算比例的標準誤時,可忽略有限母體校正因子,若樣本數為 30 位主管,則 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275頁

  8. 以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件以常態分配求二項分配近似值的作法,其中,樣本大小必須滿足以下2個條件 抽樣分配的形狀 當樣本數夠大時, 的抽樣分配可近似為常態分配。 np ≥ 5 n(1 – p) ≥ 5 以及 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275頁

  9. 的抽樣分配的形狀 • 當np≥ 5以及 n(1-p) ≥ 5, 的抽樣分配可以利用常態分配來近似。 • 在 EAI 一例中,有參加管理訓練課程的主管的母體比例 p=0.60,樣本大小為30,則 np=30(0.60)=18 且 n(1-p)=30(0.40)=12,因此,抽樣分配可以趨近常態分配,如圖 7.8 所示。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275頁

  10. 的抽樣分配的形狀 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第276頁 圖7.8

  11. 抽樣分配的實際值 • 假設某公司人事經理想要知道樣本比例 值落在母體比例±0.05 範圍內的機率為何?也就是樣本比例 值落在 0.55 到 0.65 間的機率。(母體比例P=0.6,每組樣本30個) 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第275-276頁

  12. 圖 7.9的陰影部分就是此機率。我們已知 p 抽樣分配可以用常態分配來近似,平均數為0.60,標準誤 =0.0894,則 =0.55 所對應的標準常態 z 值=(0.55-0.60)/0.894=-0.56,查標準常態分配表可知介於 z=-0.56 到 z=0 間的面積為 0.2123;同樣的在 =0.65 時,z=0 到 z=0.56 間的面積為 0.2123,因此,樣本比例 值落在母體比例 p 值 ±0.05 的機率為 0.2123+0.2123=0.4246。

  13. 抽樣分配的實際值 • 如果我們增加樣本數到 n=100,則比例的標準誤變為樣本大小為 100 位 EAI 主管的情況下,我們也可以計算樣本比例 值落在母體比例 p 值±0.05 的機率值。因抽樣分配近似常態,且平均數為 0.60,標準差為0.049,利用標準常態分配表就可以計算所要的面積或機率。 • 當 =0.55 時,z=(0.55-0.60)/0.049=-1.02,查標準常態分配表得知介於 z=-1.02 到 z=0 間的面積為 0.3461;同樣的,當 =0.65 時,介於 z=0 到 z=1.02 間的面積也為 0.3461,因此,當樣本大小由 30 增到 100 時,樣本比例 值落在母體比例 p 值 ±0.05 的機率從 0.4246 變為 0.3461+0.3461=0.6922。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第276頁

  14. 小結 • 影響抽樣分配的因素: • 母體分配、樣本統計量、樣本大小 • 母體分配、樣本分配與抽樣分配 • 母體分配 • 樣本分配 • 抽樣分配

  15. 練習 • 35

  16. 35 • 公司的總裁相信30% 的訂單來自新顧客,現以簡單隨機樣本抽出100份訂單以估計新客戶的比例。 a. 假設該總裁的認知是對的,也就是p=0.30,那麼的p-bar的抽樣分配為何? b. 樣本比例(p-bar) 介於0.20到0.40間的機率為何? c. 樣本比例p-bar介於0.25到0.35間的機率為何?

  17. 7.7 點估計量的性質 • 注意: • θ= 母體參數 • =樣本統計量或 θ 的點估計量 • θ 是希臘字母,發音是theta, 則唸做theta-hat。 • 一般而言,θ 代表任何母體參數,例如母體平均數、母體標準差及母體比例等等; 則代表對應的樣本統計量,例如樣本平均數、樣本標準差及樣本比例。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278頁

  18. 點估計量的性質 • 良好點估計量的性質有: 不偏性 有效性 一致性 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第278頁

  19. 點估計量的性質 不偏性 如果樣本統計量的期望值等於要估計的母體參數之期望值,則此樣本統計量就是母體參數的不偏估計量 (unbiased estimator)。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁

  20. 點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁

  21. 點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第279頁 圖7.10

  22. 點估計量的性質 有效性 假定有 n 個元素的簡單隨機樣本可以提供同一個母體參數兩個不偏估計量。此種情況下,我們會使用標準差較小的點估計量,因為它可以提供更接近母體參數的估計值。標準差較小的點估計量相對於其他點估計量,有更高的相對有效性(relative efficiency)。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

  23. 點估計量的性質 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁 圖7.11

  24. 點估計量的性質 一致性 優良點估計量的另一個特性是一致性(consistency)。簡單來說,當樣本變大,點估計量的數值變得更接近母體參數時,就稱點估計量是一致的。換言之,大樣本比小樣本能提供更好的點估計值。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

  25. 評註 • 我們在第 3 章說過,平均數與中位數都是集中趨勢的量數。本章只討論平均數的理由是,常態母體的母體平均數及母體中位數是相同的。而自常態母體抽樣,中位數的標準誤比平均數的標準誤大了 25%。以 EAI 問題為例,n=30,樣本平均數的標準誤是 = 730.3,中位數的標準誤則大概是 1.25(730.3) =913。因此,樣本平均數是更有效的,且有更大的機率更接近母體平均數。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第280頁

  26. 7.8 其他抽樣方法 • 分層隨機抽樣 • 叢式抽樣 • 系統抽樣 • 便利抽樣 • 判斷抽樣 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第253頁

  27. 分層隨機抽樣(stratified random sampling) 在分層隨機抽樣(stratified random sampling)中,母 體的所有元素先被區隔成數群,稱為層(strata)。 母體中每一個元素只歸屬在某一個資料層中。 較好的區分方法是資料層內的元素愈相像愈好,圖7.12 是一個母體被分成H個層的示意圖。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁

  28. 分層隨機抽樣 台灣 資訊業上班族 學生 教師 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.12

  29. 分層隨機抽樣 區隔出資料層後,再由每個資料層進行簡單隨機抽樣, 利用公式可將各分層的樣本資訊整合成我們感興趣的 母體參數估計值。 分層抽樣品質的好壞端視資料層內元素的同質性程度, 如果同質性高 (元素都很相近),則層內的變異將減少, 只要少量的抽樣資料就可以得到整個資料層的良好估 計值。 如果資料層是同質的,分層隨機抽樣的結果就和樣本數 較少的簡單隨機抽樣相同。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁

  30. 叢式抽樣(cluster sampling) 叢式抽樣 ( cluster sampling) 中,母體首先被分出幾群 ,稱為叢體(clusters)。 在理想的情況下,每一個叢體都可代表一整個母體, 就像是母體的縮小版。 叢式抽樣的好壞評斷標準在於所用的叢體對母體是否有 代表性。 如果每個叢體都能代表母體,則只抽出少數的叢體做 樣本就可得到母體參數的良好估計值。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281-282頁

  31. 叢式抽樣 台灣 台北市 新北市 高雄市 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第281頁 圖7.13

  32. 叢式抽樣 叢式抽樣主要的應用之一是地區抽樣,每一叢體可以是 城市的某個區域或其他定義清楚的地區。 優點:因為已經分成幾個叢體或地區,訪問者可在同一 地區訪問 (例如,某縣市的一個里),成本反而會降低, 時間也可縮短。 缺點:通常抽取的樣本數會比簡單隨機抽樣和分層隨機 抽樣來得多。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第282頁

  33. 系統抽樣(systematic sampling) 例如,在 5,000 個元素的母體中我們要抽出 50 個當作 樣本,可以從每 5000/50=100 個元素中抽出一個元素。 假設我們已將母體元素依序排列。這個程序是先從前 100 個元素隨機抽出一個元素,由這個被抽中的元素 開始,每隔 100 個元素,就抽出 1 個,直到抽出 50 個 元素為止。 這樣的抽樣方法比簡單隨機抽樣還要簡單。尤其當母體 元素呈隨機排序時,由於第一個被抽出的元素是隨機 決定的,系統抽樣通常也被假設為具有簡單隨機抽樣的 特性。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第282頁

  34. 系統抽樣 優點:此抽樣方法比簡單隨機抽樣簡單。 例如:從電話簿中隨機抽出第一個元素後,每隔 100個 元素,就抽出1 個。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第282頁

  35. 便利抽樣(convenience sampling) 便利抽樣 (convenience sampling) 是屬於非機率抽樣 (nonprobability sampling)方法。 樣本是否被抽出的關鍵是便利性,我們無法知道樣本 中的元素被抽中的機率。 例如教授可能以志願參與實驗的學生為樣本,因為學生 是現成的,資料取得的成本也低。 優點是樣本抽選與資料蒐集都相當簡單,但不可能以 樣本的代表性來評估樣本的「適合度」(goodness) 。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第282頁

  36. 判斷抽樣 使用判斷抽樣(judgment sampling)這個方法的研究者 必須非常瞭解研究對象,選出他認為最能代表母體的 樣本。 例如一名記者可能會選出他認為最能反應全體參議員 看法的 2 位或 3 位參議員來採訪。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第283頁

  37. 判斷抽樣 優點:樣本抽選相當簡單 缺點:選出的樣本品質端視研究者的判斷而定 。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第283頁

  38. 評註 • 我們在本章推薦使用的機率抽樣方法共有:簡單隨機抽樣、分層隨機抽樣、叢式抽樣或系統抽樣,欲知這些方法所抽出的樣本統計量是否接近母體參數,我們可以用某些公式來評估其「適合度」。便利抽樣和判斷抽樣並不能做適合度分析,因此,在解釋非機率抽樣方法得到的結果時,必須非常小心。 第7章抽樣與抽樣分配 Part B (7.6-7.8) 第283頁

  39. End of Chapter 7, Part B

  40. 43 • 青少年每天看電視的平均時間是3小時 (Barron‘s, November 8, 1999)。假定母體平均數 μ =3,母體標準差 σ=1.2小時。如果以50位青少年為樣本來研究看電視的時間。 a. 請做X-bar 的抽樣分配。

  41. 54 • Lori Jeffrey是一位成功的大學教科書業務代表。依照過去的經驗,經由電話拜訪與說明,Lori取得訂單的機率是25%,現抽出她某個月的業務電話當樣本,並假設該資料所產生的比例標準誤為0.0625。 • 本研究需要多少樣本?也就是說在那個月中Lori共打了多少通業務電話? • 令為推銷的成功率,請顯示的抽樣分配

More Related