670 likes | 919 Views
統計學 : 應用與進階. 第 1 章 : 統計學概說與資料處理. 什麼是統計學 統計學的應用 資料的種類 資料的呈現. 什麼是統計學. 統計學就是闡述如何收集 (collect), 分析 (analyze), 呈現 (present) 以及詮釋 (interpret) 資料 (data) 的一門藝術與科學 。 為何要研究資料 ? 驗證經濟理論 ( 事實上 , 我們意圖 否證經 濟理論 ) 提供經濟理論建構之指引與動機.
E N D
統計學: 應用與進階 第1章: 統計學概說與資料處理
什麼是統計學 • 統計學的應用 • 資料的種類 • 資料的呈現
什麼是統計學 • 統計學就是闡述如何收集 (collect), 分析(analyze), 呈現 (present) 以及詮釋 (interpret)資料 (data) 的一門藝術與科學。 • 為何要研究資料? • 驗證經濟理論(事實上, 我們意圖否證經濟理論)提供經濟理論建構之指引與動機
"I have no data yet. It is a capital mistaketo theorise before one has data. Insensiblyone begins to twists facts to suit theories,instead of theories to suit facts.“ Sherlock Holmes, A Scandal in Bohemia (Sir ArthurConan Doyle)
母體 vs. 樣本 • 母體:一個包含所有可能現象或結果的總合 • 樣本:觀察到的一小部份 • 抽樣:將樣本抽選出來的過程
機率 vs. 統計 • 機率模型:幫助我們了解樣本是如何由母體中抽出,以及該樣本之特性 • 統計推論:如何利用樣本推論母體特性 • 例子:如何得知本校學生的平均身高
母體 vs. 樣本/ 機率 vs. 統計 Àé âË(÷vÒ¬) Ë» À×(Îp)
統計學的應用 • 會計(e.g. 存貨盤點) • 經濟(e.g. 預測) • 投資與財務管理(e.g. 投資組合以及資產定價) • 行銷(e.g. 檢視王力宏替麥當勞代言的效果) • 生產管理(e.g. 品質管制)
失業定義 • 失業人口定義,係參採國際勞工組織(ILO)之規定,即凡在資料標準週內,年滿15 歲 • 無工作 • 隨時可以工作 • 正在尋找工作(尋找工作的方法包括託親友師長介紹、向私立就業服務機構求職、應徵廣告、招貼、向公立就業服務機構求職、參加政府考試分發等)或等待工作結果等三項條件者,謂之失業人口。
失業率計算方法 • 所謂「失業率」係指失業者占勞動力之比率,其計算方法如下:
調查範圍及對象 本調查之地區範圍為臺灣地區,包括臺灣省及各直轄市,而以現住此一地區內之普通住戶與共同事業戶戶內年滿15 歲,自由從事經濟活動之民間人口為對象,但不包括武裝勞動力及監管人口。 • 調查方法及時間 調查兼採派員面訪與電話訪問方式。調查時期定為每月辦理一次,以各月含15 日之一週為資料標準週,而於次週查填標準週內發生之事件。
抽樣計畫(抽樣設計) • .抽樣母體:以最近一年連結公務檔案整理完成之「按戶籍村里別統計資料檔」為抽樣母體。 • 本調查採用「分層二段隨機抽樣法」,第一段樣本單位定為村里,而第二段樣本單位定為戶。 • 樣本大小及抽出率:本調查估計抽出第一段樣本約為500 個村里;第二段樣本戶約20,300 戶,總抽出率約2.6‰,包括年滿15 歲人口近6萬人。依照臺灣地區的總抽出樣本按紐曼配置(Neyman Allocation)分配給20 縣市。
平均薪資 (調查範圍及對象) • 行業範圍:依中華民國行業標準分類,包含礦業及土石採取業、製造業、電力及燃氣供應業、用水供應及污染整治業、營造業、批發及零售業、住宿及餐飲業、運輸及倉儲業、資訊及通訊傳播業、金融及保險業、不動產業、專業科學及技術服務業、支援服務業、教育服務業、醫療保健及社會工作服務業、藝術娛樂及休閒服務業、其他服務業等17大行業。 • 調查對象:以公民營企業之場所單位及其受僱員工為對象。
平均薪資 (調查項目) • 一般概況:包括主要產品名稱或營業項目、本月規定每人應工作日數、每人每日應工作時數、上月底員工總數等。 • 受僱員工人數:包括經常員工與臨時員工人數、本月進入人數與退出人數。 • 受僱員工實際工作總人時數:包括正常工作時數與加班工作時數。 • 受僱員工薪資:包括經常性薪資、加班費與其他非經常性薪資。
平均薪資(調查方法) • 本調查之調查方法按行業別不同,分別採派員實地訪問調查或郵寄問卷調查或兩者混合應用方式辦理。 • 88年9月建置完成網際網路填報系統,提供受查廠商多元填報資料管道,實施以來,利用網路填報廠商日益增多,調查時效及資料品質亦較以往改善。
平均薪資 資料來源:行政院主計總處
最低工資 • 基本工資訂定,係由中央主管機關(行政院勞工委員會)設基本工資審議委員會,蒐集國家經濟發展狀況、躉售物價指數、消費者物價指數、國民所得與平均每人所得、各業勞動生產力及就業狀況、各業勞工工資、家庭收支調查統計並研究後擬訂,再報請行政院核定之
讓勞工共享經濟成長果實,以及照顧勞工朋友是政府的責任,尤其是對越弱勢的邊際勞工的照顧,政府更是責無旁貸。勞委會站在確保勞方最大權益的立場,承諾每年召開基本工資審議委員會,採取逐步到位的方式,達成勞工的期待。除此,對於勞工的照顧,不只重視基本工資,還有其他的配套措施,勞委會將持續進行勞動檢查,以維護勞工權益。讓勞工共享經濟成長果實,以及照顧勞工朋友是政府的責任,尤其是對越弱勢的邊際勞工的照顧,政府更是責無旁貸。勞委會站在確保勞方最大權益的立場,承諾每年召開基本工資審議委員會,採取逐步到位的方式,達成勞工的期待。除此,對於勞工的照顧,不只重視基本工資,還有其他的配套措施,勞委會將持續進行勞動檢查,以維護勞工權益。
出生率計算方法 • 在人口統計學中,出生率(crude birth rate,CBR) 定義為每年、每一千人當中的新生人口數, 可以數學式表達為: (「n」代表該年新生人口數,「p」當年人口總數) • 其他測知出生率的方式: (1).總體生育率(GFR,General fertility rate)- =1000名15至45歲婦女所生孩子的個數 (2).標準出生率(SBR, Standardised birth rate)- 在年齡性別組成結構和假設標準之間做比較
機率 vs. 統計 • 機率模型:幫助我們了解樣本是如何由母體中抽出,以及該樣本之特性 • 統計推論:如何利用樣本推論母體特性 • 例子:如何得知本校學生的平均身高
Q: 為什麼要學習機率模型? • A: 幫助我們在這個充滿不確定性的世界裡做決 策統計
不確定性: 例一 • 我的統計會被當掉嗎? • 如果我很用功, 會被當掉嗎? • 天曉得! • 你可能考前一天和男/女朋友吵架, 心情大壞 (random shocks/stichastic shocks)
不確定性: 例二 • 教授宣稱不會點名 • 可以快樂翹課嗎? • 天曉得! • 萬一教授反悔.....
屬質資料與屬量資料 • 屬質資料(qualitative data) 係指以非數字記錄 的統計資料 • 如性別, 職業, 科系, 校別等 • 屬量資料(quantitative data) 就是可以用數字表達的統計資料 • 如學期成績, 身高體重, 年齡等 • 屬質資料亦可用識別數字予以記錄, 譬如說, 性別的「男女」可用0 與1 予以表示
間斷資料與連續資料 • 間斷資料(離散資料): 資料為整數或是說資料間分割, 如家庭子女數, 博物館參觀人次, 網頁點擊數等 • 連續資料: 資料為實數或是說資料間不可分割,如血壓值, 家庭薪資, 身高體重等
橫斷面資料與時間數列資料 • 橫斷面資料: 在某一特定時間點, 跨個體的資料。 譬如說, 2006 年各國的經濟成長率 • 時間數列資料: 某一特定時間內演變情形的資料。譬如說, 台灣由1972 年到2006 年的經濟成長率資料
資料的次數分配 • 去年上學期班上34位同學期中考成績資料如下: 86 99 98 99 99 83 86 75 94 98 99 92 95 85 • 如何整理以及有系統地呈現這組資料?
敘述統計: 次數分配 • 把這組資料的次數分配找出來 • 你在高中學過了!
敘述統計: 次數分配 • 把這組資料的次數分配找出來
敘述統計量 • 有時候只是表列或是畫出次數分配無法提供明確的數字 • 我們可以用一些簡單的敘述性衡量來描繪分配稱做敘述統計量 • 位置的衡量 • 分散程度的衡量
位置的衡量 • 平均數(Mean):將一組數或量相加總,再除以該組數的個數,稱之為算術平均數。即若有 n 個數,其算術平均數為 • 中位數(Median):通過把所有觀察值高低排序後找出正中間的一個作爲中位數。如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作爲中位數。
n X i X X … X 1 2 n i 1 X n n Mean
Median • Position of median in sequence • Positioning Point • Ordered: 7583858686929495989899999999