1 / 124

社會統計

社會統計. 第二講 描述統計. 如何描述一組為數眾多的數值?. 開學第一堂課填答問卷的同學其身高如下: 160 、 168 、 169 、 160 、 171 、 181 、 169 、 170 、 163 、 170 、 168 、 180 、 175 、 162 、 160 、 175 、 172 、 161 、 161 、 155 、 153 、 163 、 161 、 160 、 178 共 25 位同學。 請問我們怎麼從中看出什麼意義?. 以枝葉圖表示. 以直方圖表示. 你看出了什麼?. 分配的形狀 集中於何處?平均在哪裡? 分散有多廣? *.

Download Presentation

社會統計

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 社會統計 第二講 描述統計 社會統計

  2. 如何描述一組為數眾多的數值? • 開學第一堂課填答問卷的同學其身高如下:160、168、169、160、171、181、169、170、163、170、168、180、175、162、160、175、172、161、161、155、153、163、161、160、178共25位同學。 • 請問我們怎麼從中看出什麼意義? 社會統計

  3. 以枝葉圖表示 社會統計

  4. 以直方圖表示 社會統計

  5. 你看出了什麼? • 分配的形狀 • 集中於何處?平均在哪裡? • 分散有多廣?* 社會統計

  6. Summation Notation 基本運算複習 社會統計

  7. 基本運算複習 12+16=28 社會統計

  8. 基本運算複習 社會統計

  9. 基本運算複習 社會統計

  10. 基本運算複習 社會統計

  11. 基本運算複習 是否等於 社會統計

  12. 基本運算複習 社會統計

  13. 母體平均數population mean 大N通常代表母體的個數 社會統計

  14. 樣本平均數sample mean 小n通常代表母體的個數 社會統計

  15. 次數分配(frequency distribution) • 次數分配表呈顯落在各個不同組(class)裡面觀察到的數量,在第i 組裡的次數稱為組次數,以fi來表示。 社會統計

  16. 次數分配(frequency distribution) • 社會變遷基本調查資料中,每一名受訪者皆被要求提供月薪資訊: • 第一位受訪者 月薪2.4萬 • 第二位受訪者 月薪4.5萬 …….. • 第1813位受訪者 月薪5.2萬 • 此時我們可以透過次數分配表來整理資料,以便瞭解台灣地區民眾收入的分佈情形。 社會統計

  17. 次數分配(frequency distribution) 上組界Upper limit 下組界Lower limit Width of class組距= Bk- Bk-1 組中點=(Bk+Bk-1)/2 社會統計

  18. 次數分配(frequency distribution) 組上界=2萬 組下界=1萬 組寬=1萬 組中點 = 1.5萬 社會統計

  19. 選擇組界的兩個原則(two rules for selecting classes) • 互斥性mutually exclusive:各組的組界不得重疊,即每有任何一個觀察值可以被同時分類至不同的兩個組中。 • 一般以「不含組上界值」為規範,如組上界為2萬,僅將2萬元以下的觀察值歸入該組,2萬元整及以上的觀察值歸入下一組。 • 周延性Exhaustive:所有的觀察值皆能被歸入某一組中。 社會統計

  20. 分組的其他原則 • 究竟要分幾組才恰當? • 視情況而定,一般以5-20組為原則。 • 或者可採用下列公式及算組數: • 組數=1+3.322 ×log(n樣本數) • 組寬要多大? • 最好能設等距的組寬,但如果部分觀察值的分佈情形非常集中,另一部份非常分散,則有時候會採用不等距的分組方式。 社會統計

  21. 分組的其他原則 • 組界的選擇 • 最好能夠選擇組的上下界,使組中點接近該組觀察值的平均數。因為我們在計算全體總平均時,會以組中點來代表該組的平均值,因此組中點越接近該組的平均值,估計的總平均數會越準確。 社會統計

  22. 分組的其他原則 Midpoint 200元 100元 Midpoint 50元 150元 社會統計

  23. Relative Frequency Distributions相對次數 • 相對次數為第i組的次數,佔全體的比率。 社會統計

  24. 相對次數(Relative frequency) 第二組的相對次數為: 330/1813 = 0.182 社會統計

  25. Frequency Histogram直方圖 組次數 社會統計

  26. 相對次數直方圖 • 與直方圖相同,為其縱軸改以相對次數表達 組相對次數 社會統計

  27. 分組資料的算數平均數 n 社會統計

  28. 連續性資料的算數平均數 社會統計

  29. 算數平均數 • 各個觀察值與平均數差的總和為0 證明 社會統計

  30. 算數平均數 • 各個觀察值與平均數差的平方和為最小 常數 等於0 大於等於0 社會統計

  31. 算數平均數 • 設x1, x2, x3, …xn之算數平均數為x-bar 社會統計

  32. 算數平均數 每位員工皆加薪5000元 社會統計

  33. 算數平均數 每位員工皆加薪5% 社會統計

  34. 算數平均數 • 平均值容易受到極端值的影響,若資料中有過大或過小的觀察值時,不要以平均值來代表集中趨勢。 社會統計

  35. 算數平均數 • 分組資料中若有開放式的組界,由於該組的組中點無法決定,因此其平均數亦無法計算。 社會統計

  36. Median • 將一組數字由大排至小,位居中間的數值為該組數字的中衛數。一般以Md來表示 社會統計

  37. Median中位數 • 如果一組數列有奇數個觀察值,則中位數為排序後數列的中間值 • 12 13 14 15 16 17 18 • 如果一組數列有偶數個觀察值,則中位數為排序後數列的中間兩個觀察值的算數平均數 • 12 13 14 1516 17 18 19 Md = 15.5 社會統計

  38. Median中位數 • 未分組資料求中位數: • 將n個數值由小至大排序 • 決定中位數所在的位置n/2+1/2。 • 若n為偶數,則取第n/2與第n/2+1個之數值的平均數為代表。 社會統計

  39. Median中位數 • 求下列數值的中位數: • 66 70 71 76 80 84 92 • n=7, 所以中位數所在的位置為第(7+1)/2=4第4個數值(76). • 66 70 71 76 80 84 92 96 • n=8, 中位數所在的位置為第(8+1)/2=4.5 個,取第n/2(第4個)值與第n/2+1(第五個)值的平均數 • =(76+80)/2 = 78 社會統計

  40. Median中位數 • 列舉式分組資料求中位數的步驟: • 將資料由小至大排序。 • 計算累加次數。 • 決定中位數所在的位次(n+1)/2。 • 如果中位數的位次剛好在組內,則取該組的數值x為中位數。如果位次落在兩組中間,則取兩組的平均值。 社會統計

  41. Median中位數 • 中位數的位次=94/2+1/2=47.5 • Median = 82 社會統計

  42. Median中位數 • 中位數的位次=94/2+1/2=47.5 • Median = (82+84)/2 社會統計

  43. 分組資料中位數的推估 • 分組資料(連續資料)求中位數的步驟: • 計算累加次數。 • 根據中位數所在的位次n/2+1/2,找出中位數所在的組別。 • 以下列公式求出中位數: 社會統計

  44. 分組資料中位數的推估 社會統計

  45. 分組資料中位數的推估 (1) 先將各組次數加總求出總次數,再用n/2的公式找到中位數的 社會統計

  46. 分組資料中位數的推估 (2)如果中位數的位次n/2介於Fi-1與Fi之間。 (3) 用C= Bi-Bi-1求得組距C 則中位數= 社會統計

  47. 分組資料中位數的推估 • 這個公式看起來有點複雜,其實很好理解。我們已知第n/2的數值落於該組中,我們想要找出最接近第n/2的位置的一個推估數值。 Fi-1 n/2 組距為C,組次數為f,C/f可以看成每個觀察值之間的單位距離 從第n/2個觀察值到本組的下界之間共有幾個觀察值 社會統計

  48. 分組資料中位數的推估 請找出台灣地區成年人每週工時的中位數。 社會統計

  49. 分組資料中位數的推估 步驟一:先算出累積次數 步驟二:找出中位數所在的組(n/2+1/2)。 n/2=1786/2=893 社會統計

  50. 分組資料中位數的推估 步驟三:將組界調整成為不間斷 步驟四:套入公式求組中位數: Median = 40.5+ (1786/2 – 291) * (50.5-40.5)/1001 = 46.51 社會統計

More Related