1 / 54

第六章 抽樣設計

第六章 抽樣設計. 第一節 抽樣調查的基本概念 第二節 隨機抽樣技術 第三節 非隨機抽樣技術 第四節 抽樣誤差與樣本數 第五節 有關抽樣設計的幾個問題 思考題. 一 . 抽樣調查的特點. 抽樣調查 (sampling survey) 是市場調查中使用頻率最高的一種調查方式,它是按照一定程式,從所研究物件的全體(母體)中抽取 一部分 (樣本)進行調查或觀察,並在一定的條件下,運用數理統計的原理和方法,對母體的數量特徵進行 估計 和 推斷 。.

iola-sosa
Download Presentation

第六章 抽樣設計

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 第六章 抽樣設計 第一節 抽樣調查的基本概念 第二節 隨機抽樣技術 第三節 非隨機抽樣技術 第四節 抽樣誤差與樣本數 第五節 有關抽樣設計的幾個問題 思考題

  2. 一. 抽樣調查的特點 • 抽樣調查(sampling survey)是市場調查中使用頻率最高的一種調查方式,它是按照一定程式,從所研究物件的全體(母體)中抽取一部分(樣本)進行調查或觀察,並在一定的條件下,運用數理統計的原理和方法,對母體的數量特徵進行估計和推斷。

  3. 抽樣方法可分為隨機抽樣(也稱機率抽樣probability sampling)和非隨機抽樣(非機率抽樣non- probability sampling )。 • 隨機抽樣是指按照機率原則,從母體中抽取一定數目的單位元作為樣本進行觀察,隨機抽樣使母體中每個單位都有一定的機率被選入樣本,從而使根據樣本所做出的結論對母體具有充分的代表性。

  4. 非隨機抽樣是以方便為出發點或根據研究者主觀的判斷來抽取樣本。非隨機抽樣主要依賴研究者個人的經驗和判斷,它無法估計和控制抽樣誤差,無法用樣本的量化資料來推斷母體,但非隨機抽樣簡單易行,尤其適用於做探索性研究。非隨機抽樣是以方便為出發點或根據研究者主觀的判斷來抽取樣本。非隨機抽樣主要依賴研究者個人的經驗和判斷,它無法估計和控制抽樣誤差,無法用樣本的量化資料來推斷母體,但非隨機抽樣簡單易行,尤其適用於做探索性研究。

  5. 與普查相比,抽樣調查具有以下三個顯著特點:與普查相比,抽樣調查具有以下三個顯著特點: • 經濟–人力、物力、財力上 • 高效率–易滿足時效性要求 • 準確–參加人員較單純、品質好控制

  6. 二. 抽樣調查的作用 • 對一些不可能或不必要進行普查的社會經濟現象,可用抽樣調查方式解決。例如,對有破壞性質或損耗性質的商品質量檢驗;對一些無限母體的調查(如對森林木材積蓄量調查)等。 • 在經費、人力、物力和時間有限的情況下,採用抽樣調查方式,可節省開支,爭取時效,用比較少的人力、物力和時間,達到滿意的調查效果。

  7. 抽樣調查可對同一現象在不同時間進行連續不斷的調查,可隨時瞭解現象發展變化狀況。抽樣調查可對同一現象在不同時間進行連續不斷的調查,可隨時瞭解現象發展變化狀況。 • 運用抽樣調查對普查進行驗證。 • 例如,人口普查,前後要用幾年時間才能完成。為了節省時間和經費,常用抽樣調查進行檢查和修正。 • 抽樣調查還可運用於企業管理,尤其是產品質量管理(QC),能更好地使企業為生產和市場服務。

  8. 三. 常用術語 • 母體(population)和樣本(sample) • 母體是指所要調查物件的全體。樣本是母體的一部分,由從母體中按一定程序抽得的部分個體或抽樣單元組成。 • 例如,要瞭解某種牌號電冰箱生產的質量情況,可以按抽樣理論從全部所生產的電冰箱中抽取部分進行質量檢驗,那麼全部生產的電冰箱為母體,抽中的那部分電冰箱為樣本。

  9. 母體參數和樣本統計量 • 母體參數是根據母體各單位值計算,常用的母體參數有:母體平均數、母體比例、母體變異數。 • 樣本統計量是根據樣本各單位值計算。常用的樣本統計量有樣本平均數X、樣本比例P、樣本變異數S2。

  10. 重複抽樣和不重複抽樣。 • 重複抽樣又稱有放回抽樣,是一種在母體中允許重複抽取樣本單位的抽選方法,即從母體中隨機抽出一個樣本單位後,將它再放回去,使它仍有被選取的機會,在抽樣過程中母體單位數始終相同。 • 不重複抽樣又稱無放回抽樣,即先被抽選的單位不再放回到母體中去,即任何單位一經抽出,就不會再有第二次被抽取的可能性。

  11. 抽樣底冊和抽樣單元 • 抽樣底冊是指供抽樣所用的所有調查單位的詳細名單。在市場調查前,應該視研究調查的目的考慮抽樣底冊是否合乎所需,再進行抽樣。 • 例如要從50,000名員工中抽取300名員工組成一個樣本,則50,000名員工的名冊,就是抽樣底冊。

  12. 抽樣底冊一般可採用現成的名單,如電話簿、企業名錄、企事業單位員工名冊等,在沒有現成名單的情況下,可由調查人員自己編制。抽樣底冊一般可採用現成的名單,如電話簿、企業名錄、企事業單位員工名冊等,在沒有現成名單的情況下,可由調查人員自己編制。 • 應該注意的是:在利用現有名單作為抽樣底冊時,要先對該名錄進行檢查,避免有重複、錯誤、或遺漏情況的發生,以提高樣本對母體的代表性。

  13. 四. 抽樣方案設計 • 如何兼顧抽樣效果和所付出的代價,使之能有機會結合,一直是擺在抽樣方案設計者面前的一個重要問題,也是抽樣方案設計的難點所在。

  14. 抽樣方案設計的基本內容有: • 第一、確定抽樣調查的目的、任務和要求 • 第二、確定調查物件(母體)的範圍和抽樣單位 • 第三、確定抽取樣本方法 • 第四、確定必要的樣本數 • 第五、對主要抽樣指標的精確度提出要求 • 第六、確定母體目標量的估算方法 • 第七、制訂實施母體方案的辦法和步驟

  15. 抽樣方案設計的主要程式如圖所示:

  16. 一. 簡單隨機抽樣 • 簡單隨機抽樣(simple random sampling)又稱純隨機抽樣,考慮一個包含N個單位的母體,從中抽取n個單位作為樣本。 • 簡單隨機抽樣的優點是:方法簡單直接,當母體名單完整時,可直接從中隨機抽取樣本,由於抽取機率相同,計算抽樣誤差及對母體參數加以推斷比較方便。

  17. 簡單隨機抽樣一般可採用擲硬幣、擲骰子、抽籤、查亂數表等方法抽取樣本,在市場調查中,主要運用以下兩種方法。簡單隨機抽樣一般可採用擲硬幣、擲骰子、抽籤、查亂數表等方法抽取樣本,在市場調查中,主要運用以下兩種方法。 • 抽籤法 • 就是給母體的每個單位編號,並做成號簽,把號簽混合之後,抽取所需單位數,然後,按照抽中的號碼,查對調查單位,加以登記。 • 亂數表法 • 亂數表是將0到9十個數位用完全隨機順序排列編制而得的表。

  18. 儘管簡單隨機抽樣在理論上是最符合隨機原則的,但在實際應用中則有一定的侷限性,表現在:儘管簡單隨機抽樣在理論上是最符合隨機原則的,但在實際應用中則有一定的侷限性,表現在: • 採用簡單隨機抽樣,一般須對母體各單位加以編號,而實際所需調查母體往往十分龐大,單位非常多,逐一編號相當困難。 • 某些事物無法適用簡單隨機抽樣,例如,對連續不斷生產的大量產品進行質量檢驗,就不能對全部產品進行編號抽樣。

  19. 當母體的標誌變異程度(變異數)較大時,簡單隨機抽樣的代表性就不如經過分層後再抽樣的代表性高(詳見以下的分層抽樣)。當母體的標誌變異程度(變異數)較大時,簡單隨機抽樣的代表性就不如經過分層後再抽樣的代表性高(詳見以下的分層抽樣)。 • 由於抽出樣本單位較為分散,所以調查人力、物力、費用消耗較大。因此,這種方式適用於母體單位數不太龐大以及母體分佈比較均勻的情況。 • 因此簡單隨機抽樣只適用於下列條件的情況: • 母體規模小 • 母體底冊完備且定期更新 • 當母體底冊是唯一有關母體資訊來源時

  20. 二. 系統抽樣 • 系統抽樣(systematic sampling)又稱等距抽樣,就是先將母體各單位按一定順序排列起來,然後按一定間隔來抽取樣本單位。 • 單位順序的排列方式有兩種:一種是排列順序與調查專案無關。例如,在住戶調查時,選擇住戶可以按住戶所在街區的門牌號碼排序,然後每隔若干個號碼抽選一戶進行調查;另一種是按與調查專案有關標誌排序。例如,住戶調查時,可按住戶平均月收入排序,再進行抽選。

  21. 在排序的基礎上,還要計算抽樣距離(間隔),計算公式為:抽樣距離=N/n • 確定抽選距離之後,可以從第一段距離中隨機地抽取第一個單位,也可以從任何一段的隨機位置開始,並按抽選距離繼續抽選餘下的單位,直到抽足為止。

  22. 例如,從600名大學生中抽選50名大學生進行調查,可以利用學校現有名冊按順序編號排序,從第001號編至600號。例如,從600名大學生中抽選50名大學生進行調查,可以利用學校現有名冊按順序編號排序,從第001號編至600號。 • 抽選距離N/n  600/50  12(人) • 如從第一個12人中用簡單隨機抽樣方式,抽取第一個樣本單位,如抽到的是8號,依次抽出的是20號,32號,44號……等。

  23. 系統抽樣與簡單隨機抽樣比較,可使中選單位比較均勻地分佈在母體中,尤其當被研究現象的標誌變異程度較大,而在實際工作中又不可能抽選更多的樣本單位元時,這種方式更為有效,因此,系統抽樣是市場調查中應用很廣的一種抽樣方式。系統抽樣與簡單隨機抽樣比較,可使中選單位比較均勻地分佈在母體中,尤其當被研究現象的標誌變異程度較大,而在實際工作中又不可能抽選更多的樣本單位元時,這種方式更為有效,因此,系統抽樣是市場調查中應用很廣的一種抽樣方式。

  24. 系統抽樣也有一定的侷限性,表現在: • 當抽選間隔和被調查物件本身的週期性重合時,就會影響調查的精確度。 • 如對某商場每周的商品銷售量情況進行抽樣調查,若抽取的第一個樣本是周末,抽樣間隔為7天,那麼抽取的樣本單位都是周末,而周末往往商品銷售量較大,這樣就會發生系統性偏差(即各樣本值偏向一邊),從而影響系統抽樣的代表性。

  25. 三. 分層抽樣 • 分層抽樣(stratified sampling)又稱類別抽樣,它是先將母體所有單位按某些重要標誌進行分類(層),然後在各類(層)中採用簡單隨機抽樣或系統抽樣方式抽取樣本單位的一種抽樣方式。 • 例如,對員工收入狀況進行調查,可將員工按職務不同,分為生產人員、行政人員、服務性工作人員等各層,再從各層中抽取員工。

  26. 分層抽樣中的等比例抽樣,要求各類樣本單位數的分配比例與母體單位在各類的分配比例一致,即ni /n=Ni/N(ni為從各層中抽出的子樣本數,n為樣本數,Ni為各層的母體單位數,N為母體單位總數),此種抽樣在實際工作中應用較廣。 • 非等比例抽樣,即有的層可多抽些樣本單位,有的層也可少抽些樣本單位。適用於各層的單位數相差懸殊,或層內變異數相差較大的情形。在這種情況下,如按等比例抽樣,可能在母體單位數少的層中抽取樣本單位數過少,代表性不足,;同樣,層內變異數較大的,也可多抽些樣本單位。

  27. 分層抽樣比簡單隨機抽樣和系統抽樣更為精確,能夠通過對較少的抽樣單位的調查,得到比較準確的推斷結果,特別是當母體較大、內部結構複雜時,分層抽樣常能取得令人滿意的效果。同時,分層抽樣在對母體推斷的同時,還能獲得對每層的推論,並且利於層和層之間的比較。分層抽樣比簡單隨機抽樣和系統抽樣更為精確,能夠通過對較少的抽樣單位的調查,得到比較準確的推斷結果,特別是當母體較大、內部結構複雜時,分層抽樣常能取得令人滿意的效果。同時,分層抽樣在對母體推斷的同時,還能獲得對每層的推論,並且利於層和層之間的比較。

  28. 四. 群集抽樣 • 如果若干小的抽樣單位可組合成一個較大的抽樣單位,抽樣按大的抽樣單位抽取,一旦某個抽樣單位被抽取,則調查其中每個小的抽樣單位,這種抽樣稱為群集抽樣(cluster sampling)。 • 例如,在對學生成績進行調查時,若以班級為群,抽樣時可先抽取班級,再調查每個被抽到的班級中的每一名學生。

  29. 群集抽樣的優點,是組織工作比較方便,確定一組就可以抽出許多單位進行觀察。群集抽樣的優點,是組織工作比較方便,確定一組就可以抽出許多單位進行觀察。 • 但正因為以群為單位進行抽選,抽選單位比較集中,明顯地影響了樣本分佈的均勻性。因此在抽樣單位數目相同的條件下抽樣誤差較大,代表性較低。 • 在抽樣調查實踐中,採用群集抽樣時,一般都要比其他抽樣方式抽選更多的單位,以降低抽樣誤差,提高抽樣結果的準確程度。

  30. 當然,群集抽樣的可靠程度,主要還是取決於群與群之間的差異大小,當各群間差異越小時,群集抽樣的調查結果就越準確。當然,群集抽樣的可靠程度,主要還是取決於群與群之間的差異大小,當各群間差異越小時,群集抽樣的調查結果就越準確。 • 因此,在大規模的市場調查中,當群內各單位間的差異較大,而各群之間差異較小時,才可考慮採取群集抽樣方式。 • 例如:各班差異小,班級內差異大

  31. 集群抽樣和分層抽樣都是把母體分成幾組,二者不同的地方在於:集群抽樣和分層抽樣都是把母體分成幾組,二者不同的地方在於: • 分層抽樣時每一層至少有一個抽樣單位被抽出;集群抽樣只有部份層被選為樣本。 • 分層抽樣時對每一層做抽樣取得樣本;而集群抽樣對部份層進行普查。 • 分層抽樣的目的在減少誤差,提高樣本估計值的可靠性;集群抽樣的目的在於減少成本。

  32. 五. 多階段抽樣 • 在複雜的、大規模的市場調查中,調查單位通常是採用兩階段或多階段抽取的辦法,即先抽大的調查單位,在大單位中抽小單位,再在小單位中抽更小的單位,這種抽樣組織方式稱為多階段抽樣(multi -stage sampling)。 • 例如一般全國性的意向調查可先從全國抽取若干縣市,再在縣市中抽鄉鎮市區,然後,在各鄉鎮市區中抽選住戶家庭。 • 多階段抽樣在抽取樣本及組織調查時很方便,但在設計抽樣調查方案、計算抽樣誤差和推斷母體上比較複雜。

  33. 多階段抽樣有以下兩個特點: • 一是對抽樣單位的抽選不是一步到位的,至少要兩步;二是組織調查比較方便,尤其對於那些基本單位數多且分散的母體,由於編制抽樣底冊較為困難或難以直接抽取所需樣本,就可以利用地理區域或行政系統進行多階段抽樣。

  34. 第三節 非隨機抽樣技術 一、方便抽樣 二、判斷抽樣 三、配額抽樣 四、雪球抽樣

  35. 非隨機抽樣是指抽樣時不遵循隨機原則,而是按照研究人員主觀判斷或僅按方便的原則抽選樣本。採用非隨機抽樣通常是出於下述幾個原因:非隨機抽樣是指抽樣時不遵循隨機原則,而是按照研究人員主觀判斷或僅按方便的原則抽選樣本。採用非隨機抽樣通常是出於下述幾個原因: • 受客觀條件限制,無法進行嚴格的隨機抽樣 • 為了快速獲得調查結果 • 在調查物件不確定,或無法確定的情況下採用,例如,對某一突發(偶然)事件進行現場調查等 • 母體各單位間離散程度不大,且調查員具有豐富的調查經驗時

  36. 一. 方便抽樣 • 方便抽樣(convenient sampling)又稱偶遇抽樣,是根據調查者的方便與否來抽取樣本的一種抽樣方法。如採取“街頭攔人法”,即在街上或路口任意找某個行人,將他(她)作為被訪者,進行調查。例如,在街頭向行人詢問對市場物價的看法,或請行人填寫某種問卷等。 • 方便抽樣簡便易行,能及時取得所需的資訊資料,省時、省力、節約經費,但抽樣偏差較大,一般用於非正式的探索性調查,只有在調查母體各單位之間差異不大時,抽取的樣本才有較高的代表性。

  37. 二. 判斷抽樣 • 判斷抽樣(judgment sampling)又稱目的抽樣,它是憑研究人員的主觀意願、經驗和知識,從母體中選擇具有典型代表性樣本作為調查物件的一種抽樣方法。 • 應用這種抽樣方法的前提是研究者必須對母體的有關特徵有相當高的瞭解。故其結果的客觀性常受到人們的懷疑。

  38. 三. 配額抽樣 • 配額抽樣(quota sampling)是非隨機抽樣中最流行的一種,配額抽樣類似隨機抽樣中的分層抽樣,它也是首先將母體中的所有單位按一定的標誌分為若干類(組),然後在每個類(組)中用方便抽樣或判斷抽樣方法選取樣本單位。

  39. 採用配額抽樣,事先要對母體中所有單位按其屬性、特徵分為若干類型,這些屬性、特徵稱為“控制特徵”。如被調查者的年齡、收入、職業、教育程度等,然後,按各個控制特徵分配樣本數額。採用配額抽樣,事先要對母體中所有單位按其屬性、特徵分為若干類型,這些屬性、特徵稱為“控制特徵”。如被調查者的年齡、收入、職業、教育程度等,然後,按各個控制特徵分配樣本數額。 • 配額抽樣方法簡單易行,可以保證母體的各個類別都能包括在所抽樣本之中,故與其他幾種非隨機抽樣方法相比,樣本具有較高的代表性。

  40. 四. 雪球抽樣 • 雪球抽樣(snowball sampling)是以“滾雪球”的方式抽取樣本。即通過少量樣本單位以獲取更多樣本單位的資訊。 • 這種方法的運用前提是母體樣本單位之間具有一定的聯繫,是在不甚瞭解母體的情況下對母體或母體部分單位元情況進行掌握。

  41. 例如,某研究部門在調查某市勞務市場中的保姆問題時,先訪問了7名保姆,然後請她們再提供其他保姆名單,逐步擴大到近百人。透過對這些保姆的調查,對保姆的來源地、從事工作的性質、經濟收入等狀況有了較全面的掌握。例如,某研究部門在調查某市勞務市場中的保姆問題時,先訪問了7名保姆,然後請她們再提供其他保姆名單,逐步擴大到近百人。透過對這些保姆的調查,對保姆的來源地、從事工作的性質、經濟收入等狀況有了較全面的掌握。

  42. 這種方法的優點是便於有針對性地找到被調查者,而不致於“大海撈針”。其侷限性是要求樣本單位之間必須有一定的聯繫並且願意保持和提供這種關係,否則,將會影響這種調查方法的進行和效果。這種方法的優點是便於有針對性地找到被調查者,而不致於“大海撈針”。其侷限性是要求樣本單位之間必須有一定的聯繫並且願意保持和提供這種關係,否則,將會影響這種調查方法的進行和效果。

  43. 第四節 抽樣誤差與樣本數 一、抽樣誤差的概念與種類 二、樣本數的確定

  44. 一.抽樣誤差的概念與種類 • 在市場調查中,無論是普查,還是非普查,都有可能發生誤差,調查誤差是指調查的結果和客觀實際情況的出入和差數,一般有兩種誤差存在:即非抽樣誤差和抽樣誤差。 • 非抽樣誤差是基於抽樣之外的許多其他原因而產生的誤差,從理論上看,概念性錯誤、邏輯性錯誤、對回答的錯誤解釋等都可導致此誤差的出現,故非抽樣誤差就成了調查者需認真看待的一個問題。

  45. (1) 資料的說明與調查目的不一致或不相稱; (2) 地區單位界線不清或查記不明,引起資料的遺漏或重複; (3) 訪問技術及度量方法不當,或列表、定義、說明等不清晰; (4) 缺乏熟練的訪查員; (5) 回報誤差和其他型態的回答誤差(包括不回答誤差); (6) 缺乏熟練的督導人員; (7) 基本資料的審查不當; (8) 編碼、列印、確認及製表等誤差; (9) 排版、印刷及繪圖等誤差; 非抽樣誤差產生原因如下表所示:

  46. 抽樣誤差即用樣本估計母體而產生的誤差。抽樣誤差無特定偏向,其誤差大小主要受以下三個因素影響:抽樣誤差即用樣本估計母體而產生的誤差。抽樣誤差無特定偏向,其誤差大小主要受以下三個因素影響: • 被研究母體各單位標誌值的變異程度 • 抽取的樣本數 • 抽樣調查的組織方式 • 採用不同的抽樣組織方式,也會有不同的抽樣誤差

  47. 二. 樣本數的確定 • 在開始組織抽樣調查之前,確定抽多少樣本單位是個很重要的問題,抽的數目過少,會使調查結果出現較大的誤差,與預期目標相差甚遠;而抽的數目過多,又會造成人力、財力和時間的浪費。因此,樣本數的確定,是組織抽樣調查中需要解決的一個重要問題。 • 計算所需樣本:http://www.surveysystem.com/sscalc.htm

  48. 影響樣本數的因素 • 被調查物件標誌的差異程度 • 容忍誤差(又稱極限誤差Δ)數值的大小 • 調查結果的可靠(信賴)程度 • 抽樣的方法 • 抽樣的組織形式 • 此外,根據調查經驗,調查表的回收率或訪問的成功率高低也是影響樣本數目的一個重要因素。在回收率低的情況下,應適當加大樣本數目。

  49. 確定樣本數的計算公式 • 一般習慣以95﹪的信心水準(信賴係數)為抽樣設計常模。樣本大小與抽樣誤差有絕對相關性存在,也就是樣本數大小取決於抽樣誤差的控制,所以在樣本數決定過程中,將抽樣誤差亦一併討論。樣本數的決定可因變數性質之不同而分兩點討論:

  50. 分析性變數 • 所謂分析性變數是可藉由區間尺度或比例尺度加以衡量的,也就是可用數值表示的變數,例如公斤、公尺等度量單位或人數、件數等均屬之。此類變數要估算樣本數可持用下列公式: • 信賴區間: • 抽樣誤差: • 樣本數:

More Related