150 likes | 459 Views
類別資料分析. 運用時機 一組比例值的檢定 陽明大學學生近視率 (%) 是否與全台灣的成人有所不同? 兩組比例值的檢定 陽明大學男女生的近視率是否有所不同? 一組的兩次比例值是否有所不同? 老人前後兩次觀察的憂鬱比率是否有所不同? 機率分佈 二項分佈 : binomial distribution. 二項分佈. 一組比例值 個數的平均值與變異數: np; npq 比率的平均值與變異數: p; (p q)/n 檢定值 兩組比例值:標準差與檢定值. 二項分佈的舉例 1.
E N D
類別資料分析 • 運用時機 • 一組比例值的檢定 • 陽明大學學生近視率(%)是否與全台灣的成人有所不同? • 兩組比例值的檢定 • 陽明大學男女生的近視率是否有所不同? • 一組的兩次比例值是否有所不同? • 老人前後兩次觀察的憂鬱比率是否有所不同? • 機率分佈 • 二項分佈: binomial distribution
二項分佈 • 一組比例值 • 個數的平均值與變異數:np; npq • 比率的平均值與變異數:p; (pq)/n • 檢定值 • 兩組比例值:標準差與檢定值
二項分佈的舉例 1 • 男女各約一半的人口中,某時期機車肇事死亡共120人中,男性有80人女性有40人,請問機車肇事死亡是否與性別有關? • 都市與山地國中生各100人中,近視比例分別為55與15人,請問都市與山地國中生近視比例差別的95%信賴區間為何?
二項分佈的舉例 2 • 某區域醫院了配合總額預算新制、保有一定水準的醫療品質與醫院收入,決定每天門診量不超過375人,但開放電話或電腦預約掛號到400號,因為根據以往經驗約有10%的病人掛了號卻不來看診。請問該醫院至少有一位病人掛了號卻看不到病的機率是多少?(假設病人掛號後有的看診機率為二項分布) (A).P(Z>1.96)=2.5% (B).P(Z>2.14)=1.6% (C).P(Z>2.34)=1.0% (D).P(Z>2.58)=0.5% (E).P(Z>2.8)=0.3%
卡方分佈與兩個類別變項的統計 • 使用時機:兩個類別變項間是否有相關association • 性別與自體免疫疾病的有無、注射流感疫苗與感冒發生的有無、籍貫與投票行為等 • 與比例值的意義相同 • 卡方值
卡方檢定的舉例 • 卡方分佈表與自由度 • d.f.=(No. of rows -1)*(No. of Columns-1) • 依照自由度查表 • 例題 推翻虛無假說,接受對立假說,吃鴨子與否與患傷寒有關
Yate’s校正與Fisher’s exact test • 卡方值的簡單公式: • Yats’ correction: N/2, 2× 2 table檢定時使用 • Fisher’s exact test • 使用時機 : 某些cell期望值小於5 • 舉例 所以,P=0.238+0.041=0.279>0.05,接受虛無假說
McNemar’s Test • 名稱與使用時機:非獨立樣本比率數的卡方檢定 • 觀念與配對t 檢定完全相同 • 檢定值 • 舉例: 第一次與第二次受訪老人的婚姻狀態是否有不同? 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同 結論:追蹤憂鬱老人的婚姻狀態,發現有明顯不同
適合度檢定Goodness-of-fit test • 使用時機 • 如果一個母群體,依某種分類的分布為已知,要了解一個隨機樣本是否由該母群體所抽出的檢定,就應使用適合度檢定。 • 舉例 • 高血壓會者之血型分布與常人是否相同 • 結論:接受虛無假說,高血壓患者的血型分佈與常人並無不同
波以松分佈:Poisson Test • 二項分布 • 波以松分布 • 自然對數 • 公式證明
波以松檢定:舉例 • 波以松分布 • 設台灣地區盲腸手術失敗率為0.007,某醫院進行盲腸手術400次沒有一次失敗,該院外科醫療水準是否較全國為優? • 解:設α=0.05,p=0.007, n=400 H0: 該院手術失敗率與全國相同p1= p0 H1: 該院手術失敗率較全國為低p1< p0 • 結論:接受虛無假說,該院並不比一般醫院之外科醫療水準為優
卡方分佈的濫用與討論 • 任意將等距或等比變項轉化成類別變項 • 男女的體重是否有所差別? • 分組武斷 • 體重:輕中重如何分?(BMI…?) • 自變項與依變項的因果關係 • Z 或 t 檢定:方法本身已隱含有因果關係的假定 • 卡方檢定:沒有因果關係的假設 • 但仍習慣將將「因」變項放在直行,「果」變項放在橫列
結論 • 比率檢定:Z分佈 • 與平均值檢定的觀念完全相同 • 類別變項的統計:卡方檢定 • 2×2:要做Yate’s correction • Fisher’s exact test: • 某些cell 的期望值小於5時:樣本數太小或機率值 p 太小 • McNemar’s test: 二項類別變項重複測兩次 • Poisson test: • 樣本數n很大且機率值 p很小(通常<0.01),如癌症發生比率