650 likes | 931 Views
重复抽样和不重复抽样 总体较小 总体较大. 6.2.2 系统抽样 第 1 个样本号: 15 第 2 个样本号: 15 + 25 = 40 第 3 个样本号: 15 + 2×25 = 65 第 4 个样本号: 15 + 3×25 = 90 …… 第 199 个样本号: 15 + 198×25 = 4965 系统抽样的步骤 1. 编制抽样框,并对总体的单位或元素按序编号。 2. 计算抽样间距,即 ,其中为抽样间距或间隔,为总体数,为样本数。.
E N D
重复抽样和不重复抽样 • 总体较小 • 总体较大
6.2.2 系统抽样 • 第1个样本号:15 • 第2个样本号:15+25=40 • 第3个样本号:15+2×25=65 • 第4个样本号:15+3×25=90 • …… • 第199个样本号:15+198×25=4965 • 系统抽样的步骤 • 1.编制抽样框,并对总体的单位或元素按序编号。 • 2.计算抽样间距,即 ,其中为抽样间距或间隔,为总体数,为样本数。
3.确定起抽号,即第一个样本的号码;起抽号一般按随机方法在抽样间距内获得,需要注意的是起抽号必须小于或等于抽样间距值,如果大于的话,最好一个样本号码就会超出总体数。如果上例起抽号为26,第200个样本号就是:26+199×25=5001,已经不在总体范围之内。3.确定起抽号,即第一个样本的号码;起抽号一般按随机方法在抽样间距内获得,需要注意的是起抽号必须小于或等于抽样间距值,如果大于的话,最好一个样本号码就会超出总体数。如果上例起抽号为26,第200个样本号就是:26+199×25=5001,已经不在总体范围之内。 • 4.从起抽号(F)开始,按抽样间距抽取样本,直到抽满规定的样本数。即 , , ,…, • 其中为起抽号,为抽样间距,为样本序号。上例第199个样本,、、分别为15、25、199。
抽样间距带小数: • 第1个样本号:24.21-------------→ 25 • 第2个样本号:24.21+25.06=49.27 ------→ 50 • 第3个样本号:24.21+2×25.06=74.33 -----→75 • 第4个样本号:24.21+3×25.06=99.39 -----→100 • …… • 第199个样本号:24.21+198×25.06=4986.09 --→4987 • 第200个样本号:24.21+199×25.06=5011.15 --→5012
抽样框按序排列 • 周期性误差 • 标准化“公房”住宅小区示意图
6.2.3 分层抽样 • 分层标准的选择 • 1.把需要研究的主要变量或相关变量作为分层的标准。 • 2.选择的分层标准能够反映层次或类型的主要特征,即既 • 能保证层次内部具有较大的同质性,又能保证层次之间 • 具有较大的异质性。 • 3.与上述第二条有关的是,在选择分层标准时还要考虑所 • 选择的标准能否把总体明显地分为不同的层次,或者说 • 要选择总体单位或元素中差异较大的变量作为分层标。 • 等比抽样和异比抽样 • 异比抽样的加权:
如果利用异比抽样方法所获的样本收入资料去推论总体平均收入的话,总体平均收入将会被大大低估。因为在异比抽样的情况下,样本调查的平均收入只有1500元。如果利用异比抽样方法所获的样本收入资料去推论总体平均收入的话,总体平均收入将会被大大低估。因为在异比抽样的情况下,样本调查的平均收入只有1500元。 • 男性权数: • 女性权数 :
6.2.4 整群抽样 • 整群抽样方法是把总体若干单位或元素集合在一起的群体作为抽样单位,并在总体中按随机方法抽取若干个群体,凡是抽取到的群体,其所包括的所有成员或元素都要进行调查。整群抽样方法与前三种抽样方法相比较,它的最大的特点是抽样单位是群体,而不是个体,并且被抽取的群体中的所有成员都要进行调查。需要注意的是,在整群抽样中,作为抽样单位的群体都是小群体,通常是学校里的班级、企业中的生产班组、科室,公司里的部门,以及居委会中的居民小组等。
6.2.5 多段抽样 • 多段抽样方法是以整群抽样方法为基础,是多级整群抽样,即从大群体(组织)开始抽样,再抽到比较小的群体(组织),最后抽到个人。它的抽样逻辑过程是:大群体(组织)→小群体(组织)→个人。也就是说,多段抽样方法是把抽样分成几个阶段进行。 • 降低多段抽样方法抽样误差常用方法 • 1.提高开始阶段的抽样比率 • 2.在开始阶段采取分层抽样方法 • 3.每个阶段抽样结束时根据有关指标评估样本质量
6.2.6PPS抽样 • PPS抽样方法步骤: • (1)在确定的总体内,编制单位的抽样框,给每个单位按序编号,并且统计好每个单位的人数。例如,某城市共有50所高校,收集好每所学校的学生数,给每所学校编上号码。 • (2)把每个单位的人数累积相加,根据累积人数确定每个学校的号码范围。例如,02学校的累积人数:5000+35000=40000;03学校累积人数:40000+40000=80000;两学校的号码范围分别为005001-040000、040001-080000
(3)根据规定的抽样元素数量,按照选择号码范围,查对随机数表抽取单位,也可以根据系统抽样方法抽取单位。一个单位的抽样元素内含若干个被调查对象。例如,在某城市如果有50所大学共50万名大学生,样本为2000名学生,如果一个抽样元素内含100名调查对象,一共有20个抽样元素。由于每个学校的学生数是不同的,学生比较多的学校被入选的抽样元素就越多,也就意味着被调查的学生越多。抽样元素内含的调查对象数量,主要根据第一级抽样单位覆盖面的大小来决定,也就是说,如果为了提高适当第一级样本的抽样概率,抽样元素内含的人数可以少一点。(3)根据规定的抽样元素数量,按照选择号码范围,查对随机数表抽取单位,也可以根据系统抽样方法抽取单位。一个单位的抽样元素内含若干个被调查对象。例如,在某城市如果有50所大学共50万名大学生,样本为2000名学生,如果一个抽样元素内含100名调查对象,一共有20个抽样元素。由于每个学校的学生数是不同的,学生比较多的学校被入选的抽样元素就越多,也就意味着被调查的学生越多。抽样元素内含的调查对象数量,主要根据第一级抽样单位覆盖面的大小来决定,也就是说,如果为了提高适当第一级样本的抽样概率,抽样元素内含的人数可以少一点。
在完成第一级抽样时,需要对样本质量进行评估,发现样本具有较大的偏差,可以重新抽样,直到抽取出代表性较高的样本。从抽样实践来看,在一次抽样中,系统抽样要比简单随机抽样更能体现总体结构,或者说对总体更具有代表性。在完成第一级抽样时,需要对样本质量进行评估,发现样本具有较大的偏差,可以重新抽样,直到抽取出代表性较高的样本。从抽样实践来看,在一次抽样中,系统抽样要比简单随机抽样更能体现总体结构,或者说对总体更具有代表性。 • (4)在被抽取的单位中,按照抽样元素的多少进行第二次抽样,直接抽到大学生。当然对于单位规模很大,被抽取的调查对象很多,也可以通过整群抽样方法或多段抽样方法抽取被调查对象。例如,09学校有50000名学生,被抽到两个抽样元素,即200名学生,直接抽取大学生存在一定的困难,可以通过整群抽样或多段抽样方法抽取大学生,当然也可以继续采用PPS方法抽样。
虽然就单位规模对概率的影响来说,PPS抽样方法是一种不等概率抽样,但是由于单位规模较大被抽取的概率较大,在单位内部抽取样本时,概率较小;单位规模较小被抽取的概率较小,在单位内部抽取样本时,概率较大。两相抵消,PPS抽样方法仍然是等概率抽样。虽然就单位规模对概率的影响来说,PPS抽样方法是一种不等概率抽样,但是由于单位规模较大被抽取的概率较大,在单位内部抽取样本时,概率较小;单位规模较小被抽取的概率较小,在单位内部抽取样本时,概率较大。两相抵消,PPS抽样方法仍然是等概率抽样。
例如: • 08学校被抽中的概率:20(8000/500000)=0.32 • 08学校内部学生被抽中的概率:100/8000=0.0125 • 09学校被抽中的概率:20(50000/500000)=2.0 • 09学校内部学生被抽中的概率:100/50000=0.002 • 08学校学生被抽中的概率:0.32×0.0125=0.004 • 09学校学生被抽中的概率:2.0×0.002=0.004 • 6.2.7 入户抽样
Kish抽样方法的具体步骤: • (1)调查以前,先由研究主持人将8种类型的抽样表A、B1、B2、C、D、E1、E2、F按照一定的比率分配到问卷,即指定每一份问卷采用哪一类抽样表;从A~F,8种类型的抽样表分别占问卷总数的、、、、、、、,并印制若干套(一套8种)抽样表发给调查员,每人一套。 • (2)调查员进入被调查家庭后,首先询问符合条件的家庭成员。 • (3)以性别、年龄为标准,将合乎条件的家庭成员记录下来;性别、年龄的排序按照男在前、女在后;年龄大的在前、年龄小的在后的原则。
6.2.8 样本规模和抽样方案 • 样本规模的估计 • 从抽样原理或抽样分布来说,样本规模不能少于30个单位或元素;在统计学中以30为界区分大样本和小样本,但是在调查研究中30个样本是远远不够的。 • 经验估计法:一项比较规范的研究(能够达到对较大总体的统计推论),样本规模至少要在500个以上。 • 样本规模计算公式 • 按照公式计算可以得到的不同抽样误差下的样本规模
根据简单随机抽样公式计算获得的样本量还要乘以复合抽样的设计效应系数(Deff)进行修正。根据一些专家抽样经验,我国的Deff一般为2.5。根据简单随机抽样公式计算获得的样本量还要乘以复合抽样的设计效应系数(Deff)进行修正。根据一些专家抽样经验,我国的Deff一般为2.5。 • 有限总体样本大小和计算公式 • 样本的规模占总体规模的比率超过5%,被称为有限总体。 • 影响样本规模的因素
总体规模 • 总体的差异性 • 推论的精确性和可信度:置信区间与样本量是反比关系 ;置信度和总体标准差(计算时采用相对标准差)与样本规模是正比关系 ;置信度越高,置信区间就越大。因此,我们不可能为了追求比较高的精确度,即较小的置信区间而去扩大样本量,因为较小的置信区间,只能获得较低的置信度。 • 经费、人力和时间 • 抽样方法 • 最佳样本:在规定的经费范围内达到最高的可信度和精确度;以最少的费用达到规定的可信度和精确度。
抽样方案设计 • 抽样调查目的说明 • 抽样的组织方式 • 对总体、调查对象和调查时间的说明 • 对抽样方法的详细说明 • 可能存在的问题及其控制
7.测量和量表 • 7.1 社会研究中的测量 • 7.1.1 测量的意义 • 量化测量和质化测量 • 7.1.2测量要素: • 测量对象:即测量谁或什么。测量对象一般包括对研究对象属性和某种特殊社会行为或价值观念的测量,通常它是和分析单位和研究内容联系在一起的。
测量法则:即测量规则、标准或者怎样测量。测量法则实际上是建立在概念化和操作化基础上的一套对对象属性进行测量的规则。测量法则:即测量规则、标准或者怎样测量。测量法则实际上是建立在概念化和操作化基础上的一套对对象属性进行测量的规则。 • 测量尺度:在测量过程中采用数字和符号来表示测量对象的性质、数量和类属及其在等级或性质上的差别。 • 7.1.3 “测不准原理”和社会测量的局限 • 7.2 概念化和操作化 • 7.2.1概念和概念化
例如,“失范”是社会学一个非常重要的概念,最早提出失范概念的是法国社会学家涂尔干,他在《自杀论》研究中把失范描绘成由于社会动荡和剧烈变迁带来的不确定感而导致的迷惘、焦虑、甚至自我毁灭。以后很多社会学家应用并扩展了失范这一概念。默顿(Robert Merton)认为失范产生于社会所认同的目标和手段之间的脱节;默顿之后20年,鲍威尔(Elwin Powell)对失范作出了概念化定义:当发觉自己行为的结果相互矛盾、无法运用、无足轻重的时候,失范便产生了。因为失去了方向,空虚与冷漠便伴随而来,因此,失范可以被简单地理解为“空虚”。 • 概念化是在文献分析的基础上,研究者根据自己的理解和对社会生活的观察而得出的比较严谨、比较具体的认识。
7.2.2 概念操作化 • 操作化就是用经验上可以观察的指标对一个理论概念或抽象概念进行界定,或者说概念的操作化就是概念的指标化及其包括的程序和方法。 • 7.2.3操作化过程 • 概念的操作化过程是从一个抽象的概念及其定义演绎到经验层面的过程,即从术语到定义再到经验的三角关系 。
7.3 概念、变量和指标 • 7.3.1 概念 • 概念抽象程度:概念的操作化更主要的是针对抽象程度较高的概念。 • 7.3.2 变量 • 一个概念若包括两个及以上的取值或范畴时就是变量;仅有单一的永远不变的值或范畴的概念称作常量或不变量;变量和常量是相对的,即在一定的空间条件下,有的是变量,有的是常量。 • 7.3.3指标
所谓指标就是对一个抽象概念在经验上的具体说明,是用一组可以观察到经验现象来“指示和标志”一个抽象的概念。指标和概念的操作化具有非常密切的关系,实际上一个详细具体的操作化定义就是由一组指标构成的。因此,概念的操作化就是指标建立的过程。 • 客观指标主要是用来测量社会生活的事实或条件,是反映客观状况测量指标。 • 主观指标是用来测量个人对某种现象或事物的感受、评价和态度,它是在客体和主体的相互作用过程中所形成的个人对社会客观状况的一种主观看法。
同一概念的客观指标和主观指标是有内在联系的 。 • 在设计主观指标时,不仅应该谨慎一些,而且要用一些客观指标来加以验证,并且尽可能采用客观指标。 • 测量指标和社会指标 • 指标的综合:综合相加;交互分类法 ;指数法 。
7.3.4 概念、变量和指标之间的关系 • 一般来说,在社会测量或调查研究中,变量是概念的具体表述方式,概念必须用变量的形式反映;由于概念的抽象程度有高有低,那些抽象程度较低的概念因为与经验生活直接有关,因而它们直接就是变量;对于抽象程度较高的概念,需要通过操作化的方法建立一套指标进行测量;指标是变量的特殊形式,也就是说当某个特定的变量成为某个概念的指标时,变量就是指标;但是,如果一个变量是单独存在的,不具有测量抽象概念的作用,那么它仍然是变量。因此,指标是相对于抽象程度较高的概念来说的;一旦某个抽象概念通过一套指标得到测量,这个概念就取得了变量的形式。
“职业、收入和教育程度”和“社会地位” • 相对于概念和变量来说,指标一般是具体的、是可以被观察的;但是对于一个高度抽象概念来说,有些指标本身就是概念,需要进一步操作化或指标化。 • 7.4 信度和效度 • 7.5测量层次 • 测量层次的特征和意义:第一,从定类测量到定比测量是一个递进的过程,也就是说测量层次比较高的变量同时具有测量层次比较低的所有属性。
第二,由于测量层次比较高的变量同时具有测量层次比较低的所有属性,因而测量层次比较高的变量可以转换为测量层次比较低的变量。第二,由于测量层次比较高的变量同时具有测量层次比较低的所有属性,因而测量层次比较高的变量可以转换为测量层次比较低的变量。 • 第三,判断变量所属的测量层次,最为重要的是可以帮助我们选择适合变量测量层次的计算方法,尤其是在初级统计和中级统计方法中,对于哪种类型的测量层次的变量应该采用什么样的统计方法都有严格的规定。一个基本的标准是:凡是适合于测量层次比较低的变量的统计方法,也可以用于测量层次比高的变量的计算;反之,则不行。 • 7.6 量表
7.6.1 态度和态度量表 • 社会测量或调查研究中所讲的量表,主要是用来测量人们的主观状态,包括态度、意见、价值观念等,量表也被称为态度量表。 • 态度量表是被测试者根据所提供的语句或问题回答后所获得的反映他们主观看法的一套有关联的叙述语句或问题。态度量表主要用于社会心理学的研究,但是调查研究中也会经常采用这样的形式研究人们的价值观念、态度和意见。
态度是指对待人、观念、事物具有认知、情感和行为倾向的一致性心理倾向,态度包括认知、情感和行为倾向三种因素或三个层面。态度是指对待人、观念、事物具有认知、情感和行为倾向的一致性心理倾向,态度包括认知、情感和行为倾向三种因素或三个层面。 • 认知层面:外来务工者对城市建设起到了积极作用 • 同意 不同意 • 情感层面:我愿意他们能够享受城市生活的乐趣 • 同意 不同意 • 行动倾向:我希望与他们成为真正的朋友 • 同意 不同意
社会心理学上的“态度”是一个比较宽泛的概念,它包括了意见、态度和信念等。社会心理学上的“态度”是一个比较宽泛的概念,它包括了意见、态度和信念等。 • 意见通常是对某些特殊对象或现象持续时间比较短的评价; • 态度是持续时间相对较长、涉及范围相对较广的对某种现象的评价或感受 ; • 信念即价值观念,是一个人基本的理念。 • 测量的认知、情感、行动倾向和意见、态度、信念实际上构成了态度测量由弱到强的过程:
7.6.2 总加量表 • 所谓总加量表就是根据被测试者在一组语句上测得分数相加之后,反映他们在这个量表上所测量出来的态度强弱。
总加量表的最初形式是每个语句的方向都是单维的,或者是一个方向的,回答的类别只有两个:“同意”或“不同意”,同意的就给“1”分,不同意就给“0”分;分数累计相加之后就成为这个量表测得的态度分数。总加量表的最初形式是每个语句的方向都是单维的,或者是一个方向的,回答的类别只有两个:“同意”或“不同意”,同意的就给“1”分,不同意就给“0”分;分数累计相加之后就成为这个量表测得的态度分数。 • 李克特(Likert)量表 • 李克特量表与总加量表最初形式的差别在于采用了两种方向的语句,并且要求正向语句和反向语句的语句数量基本上各占一半。 • 人际信任量表 • 李克特量表或总加量表的制作步骤
7.6.3 累积量表 • 7.6.4语义差异量表
Ⅲ 研究方式 • 8 调查研究 • 8.1 问卷设计 • 8.1.1 问卷结构与问题类型 • 8.1.2 问卷设计的原则 • 8.1.3 问卷设计的基本步骤与实例 • 8.1.4问卷设计基本技术
调查研究方法(social survey;survey research)是社会研究尤其是社会学研究最常用的方法。“调查研究”是一种量化研究方法,有些教材把它叫做“现代社会调查方法”、“社会调查”、“问卷调查”或者“统计调查”。这种研究方式的最大特点是运用概率抽样方法抽取样本或者针对总体的所有个体,采用问卷调查或登记表的方法收集资料,并在对资料的统计分析的基础上把调查结论或资料推论到样本所在的总体。
问卷设计的基本原则 • 1.问卷设计必须以研究课题和研究假设或研究设想为指导。例如,假如我们研究青少年不良行为问题,研究课题是“社会环境对青少年成长的影响”。研究假设及理论是,青少年的成长主要取决内因和外因两条件,外因虽然要通过内因起作用,但是外因对内因的形成有着重要的影响。青少年成长的外因条件,即青少年所处的社会环境对他们的成长是很重要的。因此,我们假设:社会环境愈好,青少年的成长就越健康。在设计问卷时就必须以上述课题、假设和理论为指导,具体分析社会环境应该包括哪些方面,怎么测量青少年的成长。
2. 设计好的问卷必须能够取得受访者的配合。第一,提出的问题不要超越受访者的知识背景或者认知范围。第二,尽量避免有关个人隐私或敏感性的问题,除非你的研究本身不能回避或者你的研究就是想研究这类问题,一般不要把涉及个人隐私或敏感性问题放在问卷里。第三,避免带有价值取向的用语。 • 3. 必须保证收集资料的可靠、正确和方便。第一,尽可能不要提受访者难以回答的问题或者人们往往容易忽视,而又要靠追忆才能回答的问题。第二,不要提诱导性的问题。第三,提问的方式要根据我国的社会特点和生活习惯。第四,问题中的概念和术语要考虑受访者的教育程度、职业
、年龄等社会背景,不要过于抽象,专业术语也不要太多,从而脱离受访者的知识水平。第五,提出问题最忌讳的是一些模棱两可或一题多问的问题。、年龄等社会背景,不要过于抽象,专业术语也不要太多,从而脱离受访者的知识水平。第五,提出问题最忌讳的是一些模棱两可或一题多问的问题。 • 问卷草案编制实例 :城市家庭教育方式与青少年行为偏差 • 家庭教育方式是影响青少年行为偏差的重要的因素。如果青少年刚沾染不良行为或者在模仿不良行为时,父母采取正确的教育方式,子女就可能矫正自己的不良行为,反过来则有可能是青少年慢慢地染上不良行为的恶习,并有可能成为违法犯罪的青少年。因此,我们的研究假设或研究设想是:健康的家庭教育方式是青少年培养良好行为的一个重要因素。调查对象为初中学生。 • 根据研究假设或研究设想,我们可以提出如下研究框架 :