430 likes | 947 Views
抽樣設計概論. 抽樣 ( sampling ) 的本質 自母群體中選取部分元素為樣本 , 以得知母群體的特徵 . 優點 較高的 研究品質 ( 避免 極端值 影響平均水準 , 較佳之監督與處理過程 ) 省時 破壞性實驗 不適合進行全測 優良樣本的特性 正確性 ( accuracy )( μ = μ 0 ) 精準性 ( precision )( σ→ 0 ). 抽樣程序. 1. 選定母群體. 2. 選擇抽樣架構 ( 名冊 ). 3. 選擇抽樣方法. 5. 界定誤差範圍. 4. 選擇抽樣單位. 6. 決定樣本大小. 問題討論 1. 主題: 數位課程之行銷策略
E N D
抽樣設計概論 • 抽樣(sampling)的本質 • 自母群體中選取部分元素為樣本,以得知母群體的特徵. • 優點 • 較高的研究品質(避免極端值影響平均水準,較佳之監督與處理過程) • 省時 • 破壞性實驗不適合進行全測 • 優良樣本的特性 • 正確性(accuracy)(μ= μ0) • 精準性(precision)(σ→0) 抽樣設計
抽樣程序 1.選定母群體 2.選擇抽樣架構(名冊) 3.選擇抽樣方法 5.界定誤差範圍 4.選擇抽樣單位 6.決定樣本大小 抽樣設計
問題討論1 • 主題:數位課程之行銷策略 • 預測對象世新資管大學部學生 • 問卷發放對象世新、政大、台北三所大學… • 問題 • 研究母體? • 樣本框架? • 抽樣方法? 抽樣設計
問題討論2 • ERP導入關鍵成功因素 • 母體選擇 • 產業類型―製造業、服務業… • 產業別―電子業、紡織業… • 樣本框架―前五百大、工會名冊… • MOD消費者行為分析 • 抽樣單位―個人、家庭…?「所得」的差異… 抽樣設計
問題討論3 • B2B交易平台之CRM績效影響因素―以**社群為例 • 母體選擇 • 一般業者 • B2B平台使用者 • 網路社群... • 樣本框架 • 抽樣方法 抽樣設計
機率抽樣 簡單隨機抽樣(simple random sampling) 系統抽樣(systematic sampling) 分層抽樣(stratifies sampling) 集群抽樣cluster sampling) 雙重抽樣(double sampling) 非機率抽樣 便利抽樣(convenience sampling) 判斷抽樣(judgment sampling) 配額抽樣(quota sampling) 滾雪球抽樣(snowball sampling) 抽樣設計的類型 抽樣設計
簡單隨機抽樣 • 適用環境 • 母體中每一元素都有已知非零的選擇機率 • 母體每一元素被選擇機會皆已知且相等 • 構成群體的個體均屬於同質時使用較佳 抽樣設計
問題 • 根據修課名單隨機抽30位同學測驗 • 有些同學很少來上課…? • 每天上午8:10~5:00在校園中隨機抽訪 • 產碩與碩專的同學樣本偏少… ? • 在山洞口發問卷 • 傳播學院與管理學院的學生樣本數偏少… ? 抽樣設計
中央極限定理(central limit theorem) • 不論母體本身是否為常態分配,只要每次抽樣的樣本數夠大(樣本數達30以上) ,則「平均數抽樣分配」本身仍具有常態分配的特性。 抽樣設計
2 zs ( ) n= ax 簡單隨機抽樣中樣本數之決定1 • z=期望信賴水準所必備的標準常態分配之標準差數目 • s=樣本標準差 • a=期望精確百分比 • x=樣本平均數 • n=觀測週期數 • 當樣本數在三十個以上,或母體標準差已知時,利用z值作區間估計。 • 當樣本數在三十個以下,且母體標準差未知時,須利用「t分配」代替z值。 抽樣設計
z 2 ( ) p(1-p) n= e 研究必須使用百分比估計時之樣本數決定2 • p=樣本比率 • n=樣本大小 • e=估計最大誤差 • 式中的p值為母體的真正比率.若無法得知確切的p值,可採取保守估計設定p=0.5 • 例如,若希望真正p與估計p值相差在3%以內,則樣本大小為何? 抽樣設計
範例 • 台灣電力公司於1978年12月舉辦「台灣地區家用電器普及狀況」調查研究,在決定樣本大小時,是根據1977年該公司舉辦家用電器普及狀況調查時所求之當年1月份台電14個營業處(不含花蓮、台東及澎湖)3082502用戶平均用電量為142度,變異數47078度,作為母體平均數及變異數,並限制樣本對母體之誤差不得超過四度,α=0.05,試計算樣本數。 抽樣設計
系統抽樣 • 方法 • 在資料上記編號,確定資料總數、抽樣比率。 • 從母體中第1至k個值之中隨機抽取一個樣本,以後每隔k個元素抽取一個。 • 例如:統一編號、顧客帳戶的最後幾個數字... • 優點 • 簡單,富彈性 • 問題 • 抽樣間隔與母體週期是否相同 • 母體元素是否呈單調趨勢排列 • 問題之避免 • 抽樣前隨機重排母體 • 抽樣中連續數次更改隨機開始的數字 抽樣設計
問題 • 捷運族相關之行為分析 • 每七天的第一天抽訪… • 學習成效之探討 • 學號中,每十號抽第二號… • 資訊系統導入關鍵成功因素 • 前五百大,每十號抽第七號… 抽樣設計
分層抽樣1 • 方法 • 將母體分成幾個互斥的層,然後從各層中機抽取樣本。 • 選用分層抽樣的理由 • 增加樣本的統計效率 • 提供各次群體足夠的分析資料 • 不同的層次可使用不同的研究方法及分析步驟 • 分層目標 • 層內元素同質,層與層之間為異質 • 通常分層數愈多愈能達上述目標 • 但分層數若超過6個以則此法的效益將顯著降低 抽樣設計
問題討論 • 針對世新大學的學生進行分層抽樣,分層變數之選擇… • 學院 • 系所 • 系所+年級 • 班級 抽樣設計
分層抽樣2 • 比率分層抽樣法(proportionate stratifiedsampling):各層樣本佔全部樣本比率與每一層母體所佔總母體比率相同。(各層樣本與各層母體的比率與總樣本與總母體的比率相同) • 容易執行 • 抽樣步驟可產生自我加權樣本,母體平均數可由所有樣本的平均數估計。 抽樣設計
n1 n2 ni n … = = = = N1 N2 Ni N 分層抽樣3 比率分層抽樣法 • 樣本數的決定: • N:母體數量,n:總樣本數,Ni:第i層之母體數 • ni:第i層之樣本數 • 各層樣本數與總樣本數的比例等於各層母體數與總母體數的比例 • 各層樣本數與各層母體數的比例等於總樣本數與總母體數的比例 抽樣設計
比率分層抽樣法 分層抽樣4抽樣步驟可產生自我加權樣本之證明 • 假設有A、B兩層 • N:母體數量;n:總樣本數數 • NA:第A層之母體數;NB:第B層之母體數 • nA:第A層之樣本數;nB:第B層之樣本數 抽樣設計
分層抽樣4 • 非比率分層抽樣法(disproportionate stratified sampling) • 依各層內母體數大小、內部變異性與抽樣成本,主觀判斷各層樣本大小 • 層內母體數愈大或內部變異性愈大或抽樣成本愈低,則所選的樣本愈大。 抽樣設計
分層抽樣5 • 最適分配法:在總樣本數已知,各層抽樣成本不同或各層變異數不同時適合採用最適分配法。 • 例如,將家庭分成二層:一是都市,一是農村。則都市的抽樣成本將低於農村…。 • n:樣本總數 • ni:第i層之最適樣本數 • Ni:第i層所含母體數 • σi:第i層之標準差 抽樣設計
集群抽樣 • 方法 • 將母體分成若干群體,然後隨機抽取若干群體,對群體中之各成員全部加以訪問。 • 適用場合 • 經濟效率要求較高時 • 個別元素組成的抽樣主體不易取得 抽樣設計
分層抽樣與集群抽樣的比較 抽樣設計
雙重抽樣(序列抽樣法或多階段抽樣法) • 理由 • 當母體非常大時,採用簡單隨機抽樣法,其抽出率相對的會很小,如此母體參數估計的準確度相對的也會變小;同理,執行分層隨機抽樣法時,為了將相類似的元素放在同一個層級中則層級個數勢必也相對的變大,如此便失去分層的意義;同理,執行集群隨機抽樣法時,每個群集的群集大小勢必也相對的會很大,如此,群集抽樣便失去了同時達到經濟與準確的目的了。 • 方法 • 將母體分成若干群體,用隨機方式抽取若干群體,再依據群體所含訊息選擇次樣本。 • 適用場合 • 經濟效率要求較高時 抽樣設計
雙重抽樣法範例 • 問題 • 主計處想調查全國人民的平均年所得 • 方法 • 先以全國各個縣市為抽樣單位(第一階段)執行隨行抽樣,被抽出之縣市稱為第一抽樣單位(primary-stage sampling units;psu) • 再以各個鄉鎮為抽樣單位(第二階段)而在第一抽樣單位中被抽出的鄉鎮稱為第二抽樣單位(secondary-stage sampling units;ssu)… 抽樣設計
機率抽樣法之比較 抽樣設計
機率抽樣法之範例 • 某國中共有學生2000人,其中男、女生分別有1000人;又該國中共有3個年級,其中一年級有20班,二年級有10班及三年級有10班,且每班皆有50人。校方擬抽選出100個學生以研究該國中學生的平均身高,試說明下列抽樣方法的類型: 1.校長在校門口選出100個到校的學生 2.從男、女生中分別抽選出50個學生 3.從一年級、二年級、三年級分別抽選出50、25及25個學生 4.任意從學校中抽選出2個班級 5.先任意抽選出二個年級、再從每個年級中任意抽選出50個學生 6.先任意抽選出二個年級,再從每個年級中任意抽選出5個班級再從每個班級中任意抽選出10個學生 抽樣設計
非機率抽樣 • 根據人為意志從抽樣母體中抽出比較具有代表性的樣本,故又稱為意志抽樣或計劃抽樣法(purposive sampling) 。 • 優點 • 簡單方便 • 缺點 • 樣本缺乏代表性,外部效度較差。 抽樣設計
非機率抽樣使用理由 • 若一研究不需概化(generalize)整個母體,就不需要考慮樣本是否充分反映母體。 • 成本與時間因素 • 理論上機率抽樣法較優異,但會受限於人為因素的影響。 抽樣設計
便利抽樣 • 方法 • 研究人員自由選擇遇見的任何人。 • 特性 • 最容易 • 最便宜 • 最不可靠 • 適用於探索性研究之初期訊息取得 抽樣設計
判斷抽樣(意志抽樣,purposive sampling) • 方法 • 根據研究人員主觀設定某些標準的抽樣法。 • 特性 • 適用於探索性研究之初期訊息取得 抽樣設計
配額抽樣 • 方法 • 研究人員遵照某些既定的標準來抽樣。 • 用以分配的屬性須符合兩點要求 • 可用來推估母體分配 • 與研究主題有直接關聯 • 適用環境 • 民意調查,行銷研究…等 抽樣設計
滾雪球抽樣 • 方法 • 先找幾個初始樣本當抽樣的種子,再以這些樣本外推至相關樣本單位。 • 適用環境 • 研究對象不易辨識但可循特定網路尋找時適用。(吸毒文化,幫派活動…) 抽樣設計
抽樣方法之選擇準則 • 成本 • 時間 • 母體特性資訊 • 研究目的 抽樣設計
抽樣常見之問題1 • 樣本框架之定義、選擇 • 台灣大學是第一流的學府?—樣本框架為台灣之大學 or 亞洲 or 全世界 • 樣本代表性 抽樣設計
抽樣常見之問題2 預試樣本大小 問卷中包括最多題項之「分量表」的3~5倍人數為原則。 若量表的題項數少於40題,中等的樣本數約是150位,較佳的樣本數則是200位。(Comrey,1988) 抽樣設計 36
抽樣常見之問題3 樣本大小1 樣本數100至200左右,衡量的精確性可大幅提高(Flower,1984) 以地區性的人為對象,樣本數約500~1000左右 描述性研究,樣本數至少佔母群體的10%,若母群體較小則最小樣本數最好為母群體的20%。(Gay,1992) 相關性研究,樣本至少須在30人以上。 (Gay,1992) 因果比較研究與許多實驗研究各組的人數至少要有30位。 (Gay,1992) 抽樣設計 37
抽樣常見之問題4 樣本大小2 進行因素分析時 樣本最好應有100個或以上的觀察值,通常不要少於50個觀察值。 一般原則是要求樣本數目至少要有變數個數的五倍,能有一比十的比例是較可被接受的,有些研究甚至建議觀察值個數為變數個數的二十倍。 若樣本數在300人以上時,上述之比例則不是那麼重要。 抽樣設計 38
樣本大小之考量 • 研究的特殊性 • 研究的類型 • 研究假設(例如,誤差愈小,樣本須愈大) • 經費來源,可用人力的限制 • 研究結果的重要性 • 研究變數的個數 • 資料收集的樣本異質性 • 研究要的正確性/精確度 • 母群體的大小 抽樣設計