1 / 27

调查设计与分析

调查设计与分析. 陈景武. 几个基本概念. 1. 总体与样本 2. 参数与统计量 3. 抽样研究与抽样误差 4. 概率 5. 小概率事件及小概率事件的原理 6. 参数估计 7. 假设检验. 第一节 调查研究类型. 1 、 横断面研究: 是对某人群当前特定状况的调查,因此又称现况调查。 2 、 追踪研究(队列研究): 是对不同暴露水平的对象进行追踪观察,从而分析暴露因素与疾病发生之间的因果关系、是由因寻果的调查研究。

Download Presentation

调查设计与分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 调查设计与分析 陈景武

  2. 几个基本概念 1. 总体与样本 2. 参数与统计量 3. 抽样研究与抽样误差 4. 概率 5. 小概率事件及小概率事件的原理 6. 参数估计 7. 假设检验

  3. 第一节 调查研究类型 1、横断面研究:是对某人群当前特定状况的调查,因此又称现况调查。 2、追踪研究(队列研究):是对不同暴露水平的对象进行追踪观察,从而分析暴露因素与疾病发生之间的因果关系、是由因寻果的调查研究。 3、回顾性研究(病例对照研究):是对某病的一组患者和另一组非患者进行观察,比较两组某些因素的暴露情况,从而分析该疾病与这些因素的关系。是由果推因的研究。

  4. 第二节 横断面研究的设计与分析 一、调查方法 (一)普查(全面调查)是对研究总体的所有观察单位都进行调查。目的是了解总体某一特定时点的情况。 (二)抽样调查是从总体中抽取一定数量的观察单位组成样本,根据对样本的调查信息来推论或推断总体特征。 (三)典型调查(案例调查)是选择有代表性的观察单位进行调查。用于对总体特征进行深入的研究、推论。

  5. 二、抽样方法类型 (一)非概率抽样 在抽样中各个观察单位(个体)被抽中的概率是未知的。 1、“滚雪球”抽样 2、偶遇抽样 3、典型抽样 非概率抽样可用于推论总体情况而不能推断总体参数。

  6. (二)概率抽样抽样中总体各个观察单位被抽中的概率是已知的。(二)概率抽样抽样中总体各个观察单位被抽中的概率是已知的。 (三)样本的代表性 样本对总体的代表性越好,对总体的估计越精确。样本中的个体在总体中分布越均匀,对总体的代表性越好。

  7. 三、两类总体 (一)有限总体 总体中的个体数是有确定值的。 (二)无限总体 总中的个体数是无限的。 研究者按研究目的规定的总体称为目标总体。

  8. 四、概率抽样方法 例某中学有2000名学生(6个年级、40个班、6个组/班),用抽样方法调查其近视眼患病率。 (一)简单随机抽样 1、方法先将总体中的所有个体顺序编号,再用随机的方法抽取个体组成样本。 本例学生编号:0,1,2,3,4,5,6,…,1999 随机数字: 9382,6364,3907,1063,…,0102 共200个 抽取学生编号:1382,0364,1907,1063,…,0102

  9. 总体类型 均数标准误 率的标准误 无限总体 有限总体 2、抽样误差及总体率π的估计 总体率π95%的可信区间:p-1.96Sp~p+1.96Sp

  10. 3、优缺点 (1)均数(或率)及其标准误计算简单。 (2)总体例数多时抽样麻烦。

  11. (二)系统抽样(等距或机械抽样) 1、方法 本例2000/200=10(人)— 抽样间距 0,1,2,3,4,5,6,7,8,9 样本:6,16,26,36,… ,1996 — 200人 先将总体中的个体顺序编号,再每隔相等的间隔抽取一个个体组成样本。

  12. 观测值 如 1 2 3 4 5 6 7 8 9 10 11 12 观察单位 2、优缺点   (1)简便易行,抽样误差小于简单随机抽样。   (2)无统一计算标准误的方法。在特定情况下有较大误差。 抽样样距为4:1,5,9 4 ,8,12

  13. (三)分层抽样(分类抽样) 1、方法 先将总体按某种特征的不同程度分类若干类型或组别,统计上称为不同层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。 用于分层的特征是指影响观察值变化的主要因素。   本例:6个年级,每个年级为一层,每层随机抽取1/10的学生,合起来为200学生。 2、特点                 (1)抽样误差小。   (2)便于各层单独分析和相互比较。

  14. (四)整群抽样 1、方法                班级编号:0,1,2,3,……,39      随机数字:22,56,07,97,75 ←40~79者减40,× ≥80者弃去 抽中班号:22,16,07,35   先将总体化分为若干个群,再随机抽取部分群,由抽取群的所有个体组成样本。 2、优缺点                (1)经济,易组织。   (2)抽样误差大于简单随机抽样。

  15. 2000人,6个年级,共40个班,每班50人,分为6个组。2000人,6个年级,共40个班,每班50人,分为6个组。 (五)多阶段抽样将总体分成多级抽样单位。 优缺点 1、便于组织,抽样误差小于整群抽样。 2、均数(率)及其标准误的计算随设计不同而变化。

  16. 第三节 敏感问题调查—随机应答技术   例某地区拟调查去年育龄妇女人工流产情况,用什么指标?如何调查?   随机抽取1000名育龄妇女,对每个人提出两个不相关的问题,如:             (1)去年您做过人工流产吗?(2)您去过长城吗?

  17. 设调查对象抽中(1)题的概率为:p=0.5 设调查对象抽中(2)题的概率为:1-p=0.5 样本中所有人对(1)回答是的概率为:p1——样本人工                  流产率,待求。 样本中所有人对(2)回答是的概率为:p2——再做一次                   调查,可知。 则:抽中(1)且回答是的概率为:p×p1=0.5p1。 抽中(2)且回答是的概率为:(1-p)×p2=0.5p2。 若样本中对(1)、(2)两题回答是的总率为λ

  18. n=1000 p=0.5   该地区育龄妇女人工流产率的95%可信区间 :

  19. 调查研究的用途 (一)估计总体参数 如毕业生就业的平均工资 (二)参数比较 如新旧教学方法教学质量比较 (三)相关研究 如学生综合成绩提高与哪些因 素有关 (四)回归研究 如上例综合成绩的提高与影响 因素的定量分析 (五)评价研究 改革项目多方面的综合评价 (六)其它研究 聚类分析、判别分析、对应分析等

  20. 调查研究设计方案 一、调查目的 21世纪以来,随着我国加入WTO,社会和用人单位对人才标准重新定位,对大学生—未来人才的生力军和后备力量的综合素质提出了更高的要求。本研究通过对某医科大学生综合素质影响因素分析,筛选出影响较大的指标,建立评估模型,为进一步提高大学生综合素质、完善其培养机制提供理论依据。 某医科大学学生综合素质的影响因素研究 二、调查对象与抽样方法 以某高等医学院校在校医学生为研究对象,采用分层整群抽样方法,每年级为一层,每个班为“群”的抽样单位,由抽取班的所有学生组成样本。

  21. 三、调查项目及调查量表 结合以往的文献资料,多次征求相关专家、学者意见经多次论证确定了调查内容和项目。调查项目主要包括(1)生理健康状况,如身体健康状况、户外活动等。(2)智力因素,如记忆力、逻辑思维能力、创新能力等。(3)非智力因素,如性格、意志力、自信心、兴趣等。(4)家庭环境因素,如父母职业、父母学历、家庭住址等。(5)学校环境因素,如教学质量、教学条件、学习氛围等因素(6)社会环境因素,如就业形势、就业担心等多方面的影响因素。   调查项目的答案为封闭式,采用了无序定性和有序定性两种答案,以便于logistic回归模型的量化分析。   综合分析调查目的、内容及资料分析方法的基础上,形成以下调查表:

  22. 影响医学大学生综合素质因素调查量表 亲爱的同学:   您好!大学生综合素质是我们广大师生普遍关注的问题,关系到我们将来的发展和成才。为了研究影响大学生综合素质的相关因素,从而为大学生提高自己的综合素质提供科学依据,同时也为您提供一个了解自己将来发展成才有关情况的机会,我们特地进行此次调查。对调查情况我们将严格保密,仅作研究之用,请您认真如实的填写,以便保证总体研究的可靠性和科学性,我们会为您提供一个可以查询自己测试结果的平台,您可以方便的查询到自己的测试结果。对您的真诚参与和热情支持在此表示衷心的感谢!   填写说明:本调查量表主要包括填空和选择。对于填空题,您只需在横线上填写相应的内容;对于选择题,请您在最符合您自己情况的选项上打“√”号。

  23. (一) 基本情况  学号:_________ 年龄:______ 周岁 专  业: _____________________  学历:①专科 ②专升本 ③本科 ④研究生  性别:①男 ② 女 家庭住址:① 城市 ②农村  年级: ①大一 ②大二 ③大三 ④大四 ⑤大五  政治面貌: ①群众 ②团员 ③党员

  24. (二) 调查项目 1.您自入大学以来获得过奖学金吗?① 是 ②否 (选择“是”的继续填写以下几项,选择“否”的跳过以下几项直接作答第2题)。 获得奖学金的等级,次数 (可以多选): ①一等,次数_____次 ②二等,次数_____次 ③三等,次数_____次 2.您的文化课的成绩在班级中大体排名:①上游 ②中上游 ③中游 ④中下游 ⑤下游 3.是否在班团委、学生会、各种社团担任职务: ①是 ②否 4.您感觉自己的学习兴趣:① 很浓厚 ②比较浓厚 ③一般 ④不感兴趣 ⑤很不感兴趣 • • • 36.您对自己以后的就业问题担心吗?①很担心 ②比较担心 ③不担心

  25. 四、调查方式 调查方式采取现场问卷调查方式。调查前对调查员进行严格培训,统计专业研究生进行现场调查,在班级辅导员配合下,对调查对象讲清本次调查的目的、意义以及在调查量表填写过程中应该注意的问题,并适当给与被调查者一定的物质奖励,以期获得较高依从性。问卷由调查对象在辅导员和调查员督导下独立完成填写。量表完成后及时收回,以免遗失。

  26. 五、统计分析 资料录入Excel2000 建立数据库。 (1) 采用当前对量表信度评价最常用的方法—Chronbach’s 系数法,对量表进行信度评价;采用探索性因子分析法对量表进行结构效度检验。 (2) 把经过因子分析所得的因子得分作为新变量纳入到多因素Logistic 逐步回归模型中进行分析,采用最大似然法逐步筛选变量建立最优模型, 并结合专业知识对模型拟合优度和科学性进行了分析评价。上述所有资料均使用SAS8.0和SPSS10.0软件进行统计学处理。

  27. 1. 优秀测评标准 以奖学金得分高低为判断学生优秀与否的标准。按照专家建议和相关文献,按照一等奖学金7分,二等奖学金5分、三等奖学金3分标准。平均每学期奖学金得分=总得分/学期数。平均每学期奖学金得分≥3分的判为优秀,<3分的判为不优秀。 2. 变量赋值方法 二分类资料按照不发生为0、发生为1进行量化处理;多分类有序资料进行等距自然数编码;多分类无序资料设置哑变量;连续性计量资料按等距分组转化成有序分类资料,然后进行等距自然数编码。 其余内容略

More Related