250 likes | 798 Views
Logistic 回归分析. 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw. 课程大纲. Logistic 回归分析的意涵 模型好坏的判断 回归系数的解释 二元 Logistic 回归分析 多项式 Logistic 回归分析. Logistic 回归分析的意涵. 在线性回归模型中,自变量可以是数字变量或类别变量 ( 利用虚拟变量处理 ) ,但依变量必须是数字变量,否则便会严重违反连续测量的假设。但在现实世界中,经常有许多现象是属于二分类,因此,当 Y 是二分类, X 是数字数据时,便有人想到探讨 Y=0 和 Y=1 的机率。
E N D
Logistic回归分析 庄文忠 副教授 世新大学行政管理学系 jwj@cc.shu.edu.tw SPSS之应用(庄文忠副教授)
课程大纲 • Logistic回归分析的意涵 • 模型好坏的判断 • 回归系数的解释 • 二元Logistic回归分析 • 多项式Logistic回归分析 SPSS之应用(庄文忠副教授)
Logistic回归分析的意涵 • 在线性回归模型中,自变量可以是数字变量或类别变量(利用虚拟变量处理),但依变量必须是数字变量,否则便会严重违反连续测量的假设。但在现实世界中,经常有许多现象是属于二分类,因此,当Y是二分类,X是数字数据时,便有人想到探讨Y=0和Y=1的机率。 • Logistic function SPSS之应用(庄文忠副教授)
Logistic回归分析的意涵 • 事件的机率 • 事件的胜算比(odds) X →logit form SPSS之应用(庄文忠副教授)
Logistic回归分析的意涵 • 当有k个自变数时, SPSS之应用(庄文忠副教授)
模型好坏的判断 • Pearson χ2—若logistic回归模型中的自变量都是类别数据时,则可以利用Pearson χ2的概念来检定模型是否显著。 • 离差(deviance):透过比较设计模型的最大概似值( )和饱和模型的最大概似值( )之间的差异,即可了解设计模型的好坏 df=类别组合数-模型内的系数数目(包括截距在内) SPSS之应用(庄文忠副教授)
模型好坏的判断 • Hosmer& Lemeshow检定:检定资料的分布是否符合logistic function的形式,亦即模型的配适度。 • 类判定系数(analogous R2) • 正确判断率 SPSS之应用(庄文忠副教授)
Logistic回归系数的解释 • B值—系数若是正值且达到统计上显著,即表示在控制其他自变量的条件下,对数发生比(log odds)对应自变量值增加而增加;反之,系数若是负值且达到统计上显著,即表示在控制其他自变量的条件下,对数发生比对应自变量值增加而减少。若系数在统计上不显著的话,即表示自变量的作用在统计上与0无差异。 • Wald检定—单变数的Wald统计量为自由度等于1的渐近χ2分布。 • 胜算比(odds) —odds大于1是表示事件发生的可能性会提高,或者说自变量对事件机率有正的作用; odds小于1是表示事件发生的可能性会降低,或者说自变量对事件机率有负的作用, odds等于1是表示自变量对事件机率无作用。 SPSS之应用(庄文忠副教授)
二元logistic回归分析 SPSS之应用(庄文忠副教授)
类别变量与储存的设定 SPSS之应用(庄文忠副教授)
选项的设定 SPSS之应用(庄文忠副教授)
分析结果摘要 SPSS之应用(庄文忠副教授)
预测机率与类别 SPSS之应用(庄文忠副教授)
依变量的重新编码 SPSS之应用(庄文忠副教授)
多项式logistic回归分析 SPSS之应用(庄文忠副教授)
模型与选项的设定 SPSS之应用(庄文忠副教授)
分析结果摘要 SPSS之应用(庄文忠副教授)
操作练习&提问时间 SPSS之应用(庄文忠副教授)
作业: • 自数据文件中选取(或重新编码)一个二分类的依变数,利用三个以上自变数(类别或数字均可)进行二元Logistic回归分析,并解释分析结果。 • 选取(或重新编码)一个三分类的依变数,利用三个以上自变数(类别或数字均可)进行多项式Logistic回归分析,并解释分析结果。 SPSS之应用(庄文忠副教授)