150 likes | 161 Views
类别 资料 分析 Categorical Data Analysis 王德育 (T.Y. Wang) 伊利诺州立大学 (Illinois State University) tywang@ilstu.edu. 1. 课程简介: 本课程旨在说明如何以不同的回归模型来分析 『 类别依变量 』 (categorical dependent variables). 2. 变量的种类: 连续变量( continuous variables ) 类别变量( categorical variables ): 具有穷尽且互斥的类别或记录某种现象发生的次数. 类别变量的种类:
E N D
类别资料分析Categorical Data Analysis王德育(T.Y. Wang)伊利诺州立大学(Illinois State University)tywang@ilstu.edu 1
课程简介: • 本课程旨在说明如何以不同的回归模型来分析『类别依变量』(categorical dependent variables) 2
变量的种类: • 连续变量(continuous variables) • 类别变量(categorical variables):具有穷尽且互斥的类别或记录某种现象发生的次数
类别变量的种类: • Binary variables (二分类变量)只包含两个类别,一个类别指出某一事件「有」发生或具「有」某种特质,而另一个类别则指出某一事件「没有」发生或「没有」某种特质
e.g.,有没有在最近一次居委会选举中投票?已婚还是未婚?是不是共产党党员?有没有宗教信仰?对某件事是同意还是不同意? e.g.,有没有在最近一次居委会选举中投票?已婚还是未婚?是不是共产党党员?有没有宗教信仰?对某件事是同意还是不同意?
Ordinal variables(有序多分类变量):通常有两个以上的类别,这些类别具有等级而可以排列出高低
您对自己目前工作的满意程度是怎样的呢? • 非常不满意 • 不满意 • 一般 • 满意 • 非常满意
教育水平可分为「小学及以下」 、「初中」 、「高中」 、「大学」 、与「研究生及以上」 • 收入可分为「上等水平」 、「中等水平」与 「下等水平」
Nominal variables(无序多分类变量):这类变量通常有两个以上的类别,但是这些类并不具有等级,所以不能排序
工作单位性质可分为「党政机关」、「国有企业」 、「集体企事业」 、「个体经营」 、「三资企业」 、以及「其他企业」 • 受访人的政治面貌可分为「中共党员」 、「民主党派」 、与「无党派」
Count variables (次数变量):是指某事件发生的次数,从0到正无穷大 • 美国总统否决法案的次数 • 某教授发表论文的篇数 • 非洲国家发生政变的次数
当依变量为连续变量时,我们一般可以线性模型来执行回归分析当依变量为连续变量时,我们一般可以线性模型来执行回归分析
Readings J. Scott Long and Jeremy Freese. 2006. Regression Models for Categorical Dependent Variables Using Stata (College Station, TX: Stata Corporation) J. Scott Long. 1997. Regression Models for Categorical and Limited Dependent Variables (Thousand Oaks, CA: Sage Publications) J. Scott Long著,郑旭智等译,2002.《类别与受限依变项的回归统计模式》,台北:弘智文化事业有限公司 13