1 / 66

統計學 : 應用與進階

統計學 : 應用與進階. 第 1 章 : 統計學概說與資料處理. 什麼是統計學 統計學的應用 資料的種類 資料的呈現. 什麼是統計學. 統計學就是闡述如何收集 (collect), 分析 (analyze), 呈現 (present) 以及詮釋 (interpret) 資料 (data) 的一門藝術與科學 。 為何要研究資料 ? 驗證經濟理論 ( 事實上 , 我們意圖 否證經 濟理論 ) 提供經濟理論建構之指引與動機.

lenora
Download Presentation

統計學 : 應用與進階

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 統計學: 應用與進階 第1章: 統計學概說與資料處理

  2. 什麼是統計學 • 統計學的應用 • 資料的種類 • 資料的呈現

  3. 什麼是統計學 • 統計學就是闡述如何收集 (collect), 分析(analyze), 呈現 (present) 以及詮釋 (interpret)資料 (data) 的一門藝術與科學。 • 為何要研究資料? • 驗證經濟理論(事實上, 我們意圖否證經濟理論)提供經濟理論建構之指引與動機

  4. "I have no data yet. It is a capital mistaketo theorise before one has data. Insensiblyone begins to twists facts to suit theories,instead of theories to suit facts.“ Sherlock Holmes, A Scandal in Bohemia (Sir ArthurConan Doyle)

  5. 母體 vs. 樣本 • 母體:一個包含所有可能現象或結果的總合 • 樣本:觀察到的一小部份 • 抽樣:將樣本抽選出來的過程

  6. 機率 vs. 統計 • 機率模型:幫助我們了解樣本是如何由母體中抽出,以及該樣本之特性 • 統計推論:如何利用樣本推論母體特性 • 例子:如何得知本校學生的平均身高

  7. 母體 vs. 樣本/ 機率 vs. 統計 Àé âË(÷vÒ¬) Ë» À×(Îp)

  8. 統計學的應用 • 會計(e.g. 存貨盤點) • 經濟(e.g. 預測) • 投資與財務管理(e.g. 投資組合以及資產定價) • 行銷(e.g. 檢視王力宏替麥當勞代言的效果) • 生產管理(e.g. 品質管制)

  9. 舉例:失業

  10. 失業定義 • 失業人口定義,係參採國際勞工組織(ILO)之規定,即凡在資料標準週內,年滿15 歲 • 無工作 • 隨時可以工作 • 正在尋找工作(尋找工作的方法包括託親友師長介紹、向私立就業服務機構求職、應徵廣告、招貼、向公立就業服務機構求職、參加政府考試分發等)或等待工作結果等三項條件者,謂之失業人口。

  11. 失業率計算方法 • 所謂「失業率」係指失業者占勞動力之比率,其計算方法如下:

  12. 調查範圍及對象 本調查之地區範圍為臺灣地區,包括臺灣省及各直轄市,而以現住此一地區內之普通住戶與共同事業戶戶內年滿15 歲,自由從事經濟活動之民間人口為對象,但不包括武裝勞動力及監管人口。 • 調查方法及時間 調查兼採派員面訪與電話訪問方式。調查時期定為每月辦理一次,以各月含15 日之一週為資料標準週,而於次週查填標準週內發生之事件。

  13. 抽樣計畫(抽樣設計) • .抽樣母體:以最近一年連結公務檔案整理完成之「按戶籍村里別統計資料檔」為抽樣母體。 • 本調查採用「分層二段隨機抽樣法」,第一段樣本單位定為村里,而第二段樣本單位定為戶。 • 樣本大小及抽出率:本調查估計抽出第一段樣本約為500 個村里;第二段樣本戶約20,300 戶,總抽出率約2.6‰,包括年滿15 歲人口近6萬人。依照臺灣地區的總抽出樣本按紐曼配置(Neyman Allocation)分配給20 縣市。

  14. 失業率—100/1~101/8失業率時間分布

  15. 失業率—101年8月失業率年齡分布

  16. 平均薪資 (調查範圍及對象) • 行業範圍:依中華民國行業標準分類,包含礦業及土石採取業、製造業、電力及燃氣供應業、用水供應及污染整治業、營造業、批發及零售業、住宿及餐飲業、運輸及倉儲業、資訊及通訊傳播業、金融及保險業、不動產業、專業科學及技術服務業、支援服務業、教育服務業、醫療保健及社會工作服務業、藝術娛樂及休閒服務業、其他服務業等17大行業。 • 調查對象:以公民營企業之場所單位及其受僱員工為對象。

  17. 平均薪資 (調查項目) • 一般概況:包括主要產品名稱或營業項目、本月規定每人應工作日數、每人每日應工作時數、上月底員工總數等。 • 受僱員工人數:包括經常員工與臨時員工人數、本月進入人數與退出人數。 • 受僱員工實際工作總人時數:包括正常工作時數與加班工作時數。 • 受僱員工薪資:包括經常性薪資、加班費與其他非經常性薪資。

  18. 平均薪資(調查方法) • 本調查之調查方法按行業別不同,分別採派員實地訪問調查或郵寄問卷調查或兩者混合應用方式辦理。 • 88年9月建置完成網際網路填報系統,提供受查廠商多元填報資料管道,實施以來,利用網路填報廠商日益增多,調查時效及資料品質亦較以往改善。

  19. 平均薪資 資料來源:行政院主計總處

  20. 最低工資 • 基本工資訂定,係由中央主管機關(行政院勞工委員會)設基本工資審議委員會,蒐集國家經濟發展狀況、躉售物價指數、消費者物價指數、國民所得與平均每人所得、各業勞動生產力及就業狀況、各業勞工工資、家庭收支調查統計並研究後擬訂,再報請行政院核定之

  21. 讓勞工共享經濟成長果實,以及照顧勞工朋友是政府的責任,尤其是對越弱勢的邊際勞工的照顧,政府更是責無旁貸。勞委會站在確保勞方最大權益的立場,承諾每年召開基本工資審議委員會,採取逐步到位的方式,達成勞工的期待。除此,對於勞工的照顧,不只重視基本工資,還有其他的配套措施,勞委會將持續進行勞動檢查,以維護勞工權益。讓勞工共享經濟成長果實,以及照顧勞工朋友是政府的責任,尤其是對越弱勢的邊際勞工的照顧,政府更是責無旁貸。勞委會站在確保勞方最大權益的立場,承諾每年召開基本工資審議委員會,採取逐步到位的方式,達成勞工的期待。除此,對於勞工的照顧,不只重視基本工資,還有其他的配套措施,勞委會將持續進行勞動檢查,以維護勞工權益。

  22. 生育率—1987~2011生育率時間分布

  23. 出生率計算方法 • 在人口統計學中,出生率(crude birth rate,CBR) 定義為每年、每一千人當中的新生人口數, 可以數學式表達為: (「n」代表該年新生人口數,「p」當年人口總數) • 其他測知出生率的方式: (1).總體生育率(GFR,General fertility rate)- =1000名15至45歲婦女所生孩子的個數 (2).標準出生率(SBR, Standardised birth rate)- 在年齡性別組成結構和假設標準之間做比較

  24. 機率 vs. 統計 • 機率模型:幫助我們了解樣本是如何由母體中抽出,以及該樣本之特性 • 統計推論:如何利用樣本推論母體特性 • 例子:如何得知本校學生的平均身高

  25. Q: 為什麼要學習機率模型? • A: 幫助我們在這個充滿不確定性的世界裡做決 策統計

  26. 不確定性: 例一 • 我的統計會被當掉嗎? • 如果我很用功, 會被當掉嗎? • 天曉得! • 你可能考前一天和男/女朋友吵架, 心情大壞 (random shocks/stichastic shocks)

  27. 不確定性: 例二 • 教授宣稱不會點名 • 可以快樂翹課嗎? • 天曉得! • 萬一教授反悔.....

  28. 屬質資料與屬量資料 • 屬質資料(qualitative data) 係指以非數字記錄 的統計資料 • 如性別, 職業, 科系, 校別等 • 屬量資料(quantitative data) 就是可以用數字表達的統計資料 • 如學期成績, 身高體重, 年齡等 • 屬質資料亦可用識別數字予以記錄, 譬如說, 性別的「男女」可用0 與1 予以表示

  29. 間斷資料與連續資料 • 間斷資料(離散資料): 資料為整數或是說資料間分割, 如家庭子女數, 博物館參觀人次, 網頁點擊數等 • 連續資料: 資料為實數或是說資料間不可分割,如血壓值, 家庭薪資, 身高體重等

  30. 橫斷面資料與時間數列資料 • 橫斷面資料: 在某一特定時間點, 跨個體的資料。 譬如說, 2006 年各國的經濟成長率 • 時間數列資料: 某一特定時間內演變情形的資料。譬如說, 台灣由1972 年到2006 年的經濟成長率資料

  31. 資料的次數分配 • 去年上學期班上34位同學期中考成績資料如下: 76 71 88 96 84 79 80 79 85 66 66 39 86 86 74 42 86 99 0 86 65 86 87 80 74 89 71 88 61 54 79 76 89 52 • 如何整理以及有系統地呈現這組資料?

  32. 敘述統計: 次數分配 • 把這組資料的次數分配找出來 • 你在高中學過了!

  33. 敘述統計: 次數分配 • 把這組資料的次數分配找出來

  34. 次數分配表

  35. 次數分配圖

  36. 敘述統計量 • 有時候只是表列或是畫出次數分配無法提供明確的數字 • 我們可以用一些簡單的敘述性衡量來描繪分配稱做敘述統計量 • 位置的衡量 • 分散程度的衡量

  37. 位置的衡量 • 平均數(Mean):將一組數或量相加總,再除以該組數的個數,稱之為算術平均數。即若有 n 個數,其算術平均數為 • 中位數(Median):通過把所有觀察值高低排序後找出正中間的一個作爲中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作爲中位數。

  38. n  X i X  X  …  X 1 2 n i  1 X   n n Mean

  39. 1 n  Positioning Point 2 Median • Position of median in sequence • Ordered: 0 39 42 52 54 61 65 66 66 71 71 74 74 76 76 79 79 79 80 80 84 85 86 86 86 86 86 87 88 88 89 89 96 99

More Related