1.24k likes | 1.44k Views
社會統計. 第二講 描述統計. 如何描述一組為數眾多的數值?. 開學第一堂課填答問卷的同學其身高如下: 160 、 168 、 169 、 160 、 171 、 181 、 169 、 170 、 163 、 170 、 168 、 180 、 175 、 162 、 160 、 175 、 172 、 161 、 161 、 155 、 153 、 163 、 161 、 160 、 178 共 25 位同學。 請問我們怎麼從中看出什麼意義?. 以枝葉圖表示. 以直方圖表示. 你看出了什麼?. 分配的形狀 集中於何處?平均在哪裡? 分散有多廣? *.
E N D
社會統計 第二講 描述統計 社會統計
如何描述一組為數眾多的數值? • 開學第一堂課填答問卷的同學其身高如下:160、168、169、160、171、181、169、170、163、170、168、180、175、162、160、175、172、161、161、155、153、163、161、160、178共25位同學。 • 請問我們怎麼從中看出什麼意義? 社會統計
以枝葉圖表示 社會統計
以直方圖表示 社會統計
你看出了什麼? • 分配的形狀 • 集中於何處?平均在哪裡? • 分散有多廣?* 社會統計
基本運算複習 12+16=28 社會統計
基本運算複習 社會統計
基本運算複習 社會統計
基本運算複習 社會統計
基本運算複習 是否等於 社會統計
基本運算複習 社會統計
母體平均數population mean 大N通常代表母體的個數 社會統計
樣本平均數sample mean 小n通常代表母體的個數 社會統計
次數分配(frequency distribution) • 次數分配表呈顯落在各個不同組(class)裡面觀察到的數量,在第i 組裡的次數稱為組次數,以fi來表示。 社會統計
次數分配(frequency distribution) • 社會變遷基本調查資料中,每一名受訪者皆被要求提供月薪資訊: • 第一位受訪者 月薪2.4萬 • 第二位受訪者 月薪4.5萬 …….. • 第1813位受訪者 月薪5.2萬 • 此時我們可以透過次數分配表來整理資料,以便瞭解台灣地區民眾收入的分佈情形。 社會統計
次數分配(frequency distribution) 上組界Upper limit 下組界Lower limit Width of class組距= Bk- Bk-1 組中點=(Bk+Bk-1)/2 社會統計
次數分配(frequency distribution) 組上界=2萬 組下界=1萬 組寬=1萬 組中點 = 1.5萬 社會統計
選擇組界的兩個原則(two rules for selecting classes) • 互斥性mutually exclusive:各組的組界不得重疊,即每有任何一個觀察值可以被同時分類至不同的兩個組中。 • 一般以「不含組上界值」為規範,如組上界為2萬,僅將2萬元以下的觀察值歸入該組,2萬元整及以上的觀察值歸入下一組。 • 周延性Exhaustive:所有的觀察值皆能被歸入某一組中。 社會統計
分組的其他原則 • 究竟要分幾組才恰當? • 視情況而定,一般以5-20組為原則。 • 或者可採用下列公式及算組數: • 組數=1+3.322 ×log(n樣本數) • 組寬要多大? • 最好能設等距的組寬,但如果部分觀察值的分佈情形非常集中,另一部份非常分散,則有時候會採用不等距的分組方式。 社會統計
分組的其他原則 • 組界的選擇 • 最好能夠選擇組的上下界,使組中點接近該組觀察值的平均數。因為我們在計算全體總平均時,會以組中點來代表該組的平均值,因此組中點越接近該組的平均值,估計的總平均數會越準確。 社會統計
分組的其他原則 Midpoint 200元 100元 Midpoint 50元 150元 社會統計
Relative Frequency Distributions相對次數 • 相對次數為第i組的次數,佔全體的比率。 社會統計
相對次數(Relative frequency) 第二組的相對次數為: 330/1813 = 0.182 社會統計
Frequency Histogram直方圖 組次數 社會統計
相對次數直方圖 • 與直方圖相同,為其縱軸改以相對次數表達 組相對次數 社會統計
分組資料的算數平均數 n 社會統計
連續性資料的算數平均數 社會統計
算數平均數 • 各個觀察值與平均數差的總和為0 證明 社會統計
算數平均數 • 各個觀察值與平均數差的平方和為最小 常數 等於0 大於等於0 社會統計
算數平均數 • 設x1, x2, x3, …xn之算數平均數為x-bar 社會統計
算數平均數 每位員工皆加薪5000元 社會統計
算數平均數 每位員工皆加薪5% 社會統計
算數平均數 • 平均值容易受到極端值的影響,若資料中有過大或過小的觀察值時,不要以平均值來代表集中趨勢。 社會統計
算數平均數 • 分組資料中若有開放式的組界,由於該組的組中點無法決定,因此其平均數亦無法計算。 社會統計
Median • 將一組數字由大排至小,位居中間的數值為該組數字的中衛數。一般以Md來表示 社會統計
Median中位數 • 如果一組數列有奇數個觀察值,則中位數為排序後數列的中間值 • 12 13 14 15 16 17 18 • 如果一組數列有偶數個觀察值,則中位數為排序後數列的中間兩個觀察值的算數平均數 • 12 13 14 1516 17 18 19 Md = 15.5 社會統計
Median中位數 • 未分組資料求中位數: • 將n個數值由小至大排序 • 決定中位數所在的位置n/2+1/2。 • 若n為偶數,則取第n/2與第n/2+1個之數值的平均數為代表。 社會統計
Median中位數 • 求下列數值的中位數: • 66 70 71 76 80 84 92 • n=7, 所以中位數所在的位置為第(7+1)/2=4第4個數值(76). • 66 70 71 76 80 84 92 96 • n=8, 中位數所在的位置為第(8+1)/2=4.5 個,取第n/2(第4個)值與第n/2+1(第五個)值的平均數 • =(76+80)/2 = 78 社會統計
Median中位數 • 列舉式分組資料求中位數的步驟: • 將資料由小至大排序。 • 計算累加次數。 • 決定中位數所在的位次(n+1)/2。 • 如果中位數的位次剛好在組內,則取該組的數值x為中位數。如果位次落在兩組中間,則取兩組的平均值。 社會統計
Median中位數 • 中位數的位次=94/2+1/2=47.5 • Median = 82 社會統計
Median中位數 • 中位數的位次=94/2+1/2=47.5 • Median = (82+84)/2 社會統計
分組資料中位數的推估 • 分組資料(連續資料)求中位數的步驟: • 計算累加次數。 • 根據中位數所在的位次n/2+1/2,找出中位數所在的組別。 • 以下列公式求出中位數: 社會統計
分組資料中位數的推估 社會統計
分組資料中位數的推估 (1) 先將各組次數加總求出總次數,再用n/2的公式找到中位數的 社會統計
分組資料中位數的推估 (2)如果中位數的位次n/2介於Fi-1與Fi之間。 (3) 用C= Bi-Bi-1求得組距C 則中位數= 社會統計
分組資料中位數的推估 • 這個公式看起來有點複雜,其實很好理解。我們已知第n/2的數值落於該組中,我們想要找出最接近第n/2的位置的一個推估數值。 Fi-1 n/2 組距為C,組次數為f,C/f可以看成每個觀察值之間的單位距離 從第n/2個觀察值到本組的下界之間共有幾個觀察值 社會統計
分組資料中位數的推估 請找出台灣地區成年人每週工時的中位數。 社會統計
分組資料中位數的推估 步驟一:先算出累積次數 步驟二:找出中位數所在的組(n/2+1/2)。 n/2=1786/2=893 社會統計
分組資料中位數的推估 步驟三:將組界調整成為不間斷 步驟四:套入公式求組中位數: Median = 40.5+ (1786/2 – 291) * (50.5-40.5)/1001 = 46.51 社會統計