120 likes | 333 Views
統計學複習 0508. 抽樣分配. 母體參數 (Parameter) 描述母體資料特性的統計測量數,為未知但固定的數。 樣本統計量 (Statistics) 為一組隨機樣本的實數值函數。 抽樣分配 (Sampling Distribution) 樣本統計量為一隨機變數,其機率分配稱為抽樣分配。. 抽自無限母體:. 樣本平均數的抽樣分配. 自一大小為 N 的母體抽出一組隨機樣本, 則樣本平均數 本身亦為隨機變數, 有其機率分配。. 抽自有限母體:. 大樣本 (n ≧ 30). 中央極限定理 =>. 常態分配性質. 常態分配.
E N D
抽樣分配 • 母體參數(Parameter) • 描述母體資料特性的統計測量數,為未知但固定的數。 • 樣本統計量(Statistics) • 為一組隨機樣本的實數值函數。 • 抽樣分配(Sampling Distribution) • 樣本統計量為一隨機變數,其機率分配稱為抽樣分配。
抽自無限母體: 樣本平均數的抽樣分配 • 自一大小為N的母體抽出一組隨機樣本, 則樣本平均數 本身亦為隨機變數, 有其機率分配。 抽自有限母體:
大樣本 (n≧ 30) 中央極限定理=> 常態分配性質 常態分配 母體σ已知=> 常態分配性質 小樣本 (n< 30) 母體 母體σ未知=> t分配性質 大樣本 (n≧ 30) 中央極限定理=> 常態分配性質 非常態分配 小樣本 (n< 30) 視母體分配而定 抽樣分配的型態
統計估計 • 利用樣本統計量去推估母體參數的方法。 • 點估計(Point Estimation) • 根據樣本資料求得一估計值,以推估未知的母體參數。 • 評估估計量的好壞: • 不偏性(unbiasde)、有效性(efficiency) • 區間估計(Interval Estimation) • 根據樣本資料求得之點估計值,藉由點估計值統計量的抽樣分配性質求出兩個數值所構成的區間,並利用此一區間推估未知的母體參數範圍。
μ 25,416 28,984 估計大學應屆畢業生平均薪資,若我們以 =27,200元為中心加減某個數字,譬如1,784,得到(27,200-1,784)~(27,200+1,784)元的一個區間,然後我們可以說『所有大學應屆畢業生每月的平均薪資在25,416~28,984元之間』,並說平均薪資在25,416~28,984元之間的可靠度為95%。 此一過程稱為區間估計,而此一區間稱為信賴區間(Confidence Interval),95%稱為信心水準(Confidence Level)。
樣本大小為36,故為大樣本,所以 的抽樣分配為常態分配。 信賴區間=1-α =0.95,α/2=0.025, 0.95 μ 抽樣誤差 某保險公司自其投保人的母體中隨機抽出36位投保人,計算出此36位投保人的平均年齡為 =39.58歲,已知母體標準差為σ=7.2歲,試求出母體平均數μ的95%信賴區間。
假設檢定(Hypothesis Testing) • 是對母體參數(特性)提出假設(或主張),利用樣本的訊息,決定接受該假設或拒絕該假設的統計方法。 • 虛無假設 (Null Hypothesis) • 對立假設 (Alternative Hypothesis) • 基本精神: • 除非具有足夠的證據可以否決 ,否則我們只好接受 ;但是接受 並不表示 為真,僅表示我們沒有足夠的證據可以拒絕 ;相對的,拒絕 時僅表示我們具有充分的證據可以拒絕 ,此時此檢定稱為具顯著性(Significance)。 • 統計假設檢定亦稱為顯著性檢定(Significant Testing)。
為真 拒絕 α 接受域 拒絕域 為假 接受 β 型I 誤差與型II 誤差
α α α α 拒絕域 接受域 接受域 拒絕域 拒絕域 接受域 拒絕域 左尾檢定 右尾檢定 雙尾檢定 • 假設檢定分為單尾檢定(One-tailed Test)與雙尾檢定(Two-tailed Test)。
=> => H0成立之下, 的抽樣分配 某廠商宣稱其所開發的新合成釣魚線平均強度為8公斤,標準差為0.5公斤。茲從其中隨機抽出50條釣魚線,測試其強度結果平均為7.8公斤。請在0.01顯著水準下,檢定廠商的宣稱。 首先建立虛無假設,此為雙尾檢定,H0:μ=8 ;H1:μ≠8 接受域 拒絕域 拒絕域 α/2=0.005 α/2=0.005
真正瞭解統計顯著性的意義 • 樣本愈多愈容易拒絕虛無假設。 • 統計上的顯著度和實際上的顯著度是不一樣的。除了注意P值外,要多花點時間看看資料本身(畫圖)。 • 選擇顯著水準。 • 不要忽略沒有顯著性的結果。