1 / 56

模块四 抽样方案的设计及实务

模块四 抽样方案的设计及实务. 授课安排表( 10 学时). 一、教学目标 1. 知识目标:了解抽样调查的含义、意义和程序,掌握各种类型概率抽样技术和非概率抽样的类型和优缺点,学会抽样误差的分析及计算。 2. 能力目标:培养学习团队合作为各种类型项目选择一种合适的抽样设计方案能力。 3. 技能目标:培养学生如何在实际项目中选择一种合适的抽样设计方案。. 导入案例一:. W 市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。

lelia
Download Presentation

模块四 抽样方案的设计及实务

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 模块四 抽样方案的设计及实务

  2. 授课安排表(10学时)

  3. 一、教学目标 • 1. 知识目标:了解抽样调查的含义、意义和程序,掌握各种类型概率抽样技术和非概率抽样的类型和优缺点,学会抽样误差的分析及计算。 • 2. 能力目标:培养学习团队合作为各种类型项目选择一种合适的抽样设计方案能力。 • 3. 技能目标:培养学生如何在实际项目中选择一种合适的抽样设计方案。

  4. 导入案例一: • W市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。 • 为了减少成本,公司员工自己实施了调查,他们对公司周围的人及自己的亲朋好友进行了移动公司知名度、美誉度的调查。结果发现,移动公司的知名度和美誉度都远比竞争对手高。 • 公司营销部经理对此百思不得其解。 • 移动公司的这种调查结果可信吗?

  5. 导入案例二: • W市移动通信公司近期销售业绩平平,而远没有竞争对手联通公司好。他们便对客户实施了一次市场调查,希望能找出原因,提高公司业绩。 • 为了减少成本,公司员工自己实施了调查,他们对公司周围的人及自己的亲朋好友进行了移动公司知名度、美誉度的调查。结果发现,移动公司的知名度和美誉度都远比竞争对手高。 • 公司营销部经理对此百思不得其解。 • 移动公司的这种调查结果可信吗?

  6. 学习任务: • 学习任务一:通过课堂教学学习如何进行抽样和对抽样过程进行管理。 • 学习任务二:以小组为单位指导学生制作抽样方案。并对问卷进行试调查。 • 学习任务三:对小组成员进行抽样的选择和培训。

  7. 一、抽样 (一)抽样的相关概念 1、总体 总体是构成它的所有元素的集合。 元素则是构成总体的最基本单位。 一个总体中所包含的元素数目常用大写字母N表示。

  8. 2、样本 • 就是从总体中按一定方式抽取出的一部分元素的集合。样本中的元素数目通常用小写字母n表示。 • 3、抽样 • 指的是从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素(总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。

  9. 4、抽样单位 • 就是一次直接的抽样所使用的基本单位。 • 5、抽样框 • 又称作抽样范围,指的是一次直接抽样时总体中所有抽样单位的名单。

  10. 6、参数值 • 也称为总体值,它是关于总体中某一变量的综合描述,或者说是总体中所有元素的某种特征的综合数量表现。在统计中,最常见的参数值是总体某一变量的平均数。 • 7、统计值 • 也称为样本值,它是关于样本中某一变量的综合描述,或者说是样本中所有元素的某种特征的综合数量表现。统计值是从样本中计算出来的,它是相应的参数值的估计量。

  11. 8、置信度 • 又称为置信水平,它指的是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。 • 9、置信区间 • 它是指在一定的置信度下,样本统计值与总体参数值之间的误差范围。置信区间反映的是抽样的精确性程度。

  12. (二)抽样的作用 • 向人们提供一种实现“由部分认识总体”这一目标的途径和手段。 1、有利于调研项目的顺利开展和进行 2、有利于提高调研工作的速度和效率 3、有利于降低调研成本 4、有利于提高调查结果的准确性

  13. (三)抽样的类型 • 根据抽取对象的具体方式,抽样被分为: • 概率抽样:按照等概率原则进行的抽样 ,避免人为误差,保证样本的代表性 。 • 非概率抽样:依据研究者的主观意愿、判断或是否方便等因素来抽取对象 。往往产生较大的误差,难以保证样本的代表性。

  14. 1984年美国总统选举预测与实际结果比较(%)

  15. 二、概率抽样的原理与程序 • 1、概率抽样的基本原理 • 抽样的最终目的在于通过对样本统计值的描述来勾画出总体的面貌 • 其原理就在于它能够很好地按总体内在结构中所蕴含的各种随机事件的概率来构成样本,使样本成为总体的缩影。

  16. 2、抽样的一般程序 • (1)界定总体 • 就是在具体抽样前,首先对从中抽取样本的总体范围与界限作明确的界定。 • (2)制定抽样框 • 这一步骤任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。

  17. [案例]1936年美国总统大选的民意测验 • 总统选举投票前,《文摘》杂志通过电话号码薄和汽车登记簿寄出10000万张询问投票倾向的明信片,然后依据收回的200万份调查结果极其自信地预测共和党候选人兰登将以领先15%的得票率战胜民主党候选人罗斯福而当选总统。然而,选举结果使预测者们大失所望;获胜者不是兰登,而是罗斯福。并且其得票率反超过兰登20%!《文摘》杂志的声誉一扫而光,不久就因此而关了门。 • 是什么原因导致《文摘》杂志的预测失败了呢?

  18. (3)决定抽样方案 • 我们应根据不同研究目的、不同调查范围、不同调查对象、不同抽样方法特点及其他有关因素来决定具体采用哪种抽样方法。 • (4)实际抽取样本 • 既可以先抽好样本,再下去直接对预先抽好的调查对象进行调查,也可以一边抽取样本,一边就开始调查。

  19. (5)评估样本质量 • 样本评估:就是对样本的质量、代表性、偏差等等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致调查的失误。 • 评估样本的基本方法是:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很少,则可认为样本的质量较高,代表性较大;反之,若二者之间差别十分明显,那么样本的质量和代表性就一定不会很高。

  20. 三、概述抽样方法 • (一)概率抽样的概念及特点: • 是按照等概率原理从调研总体中抽取一定数目的样本单位进行调查,以其结果推断总体的一种调研方式。其特点有: • 1、从全部调研总体中只抽取一部分单位进行调研。 • 2、从总体中抽出来的部分单位,是按随机原则抽取的。 • 3、以样本值推断总体值,并可计算出抽样推断产生的误差大小,也可在调研之前将其误差控制在一定范围之内。 • 4、它是一种侧重于定量分析的调研方式。

  21. (二)概率抽样调研的适用范围 • 1、总体范围大、单位数目多,不必要进行全面调研的情况。 • 2、某些调研对象总体为无限总体,无法进行全面调研。 • 3、调研对象总体虽非无限总体,但不可能(或不允许)进行全面调研。 • 4、对全面调研统计资料的质量进行检查与修正。

  22. (三)概率抽样的类型 • 1、简单随机抽样 • 它又称纯随机抽样,是概率抽样的最基本形式。在总体中不进行任何有目的的选择,而是按照随机的原则、纯粹偶然的方法抽取样本。 • 常用的办法:抽签法和乱数表法。 • 特点:简单、方便,但只适合规模小的样本.

  23. 案例 • 某居民区有620户居民,抽取15户调查其家庭收入。

  24. 2、系统抽样 • 又称为等距抽样、机械抽样或间隔抽样,是运用等距离抽样技术抽样,先在总体中按一定标志把个体顺序排列,并根据总体单位数和样本单位数计算出抽样距离(即相同的间隔),然后按相同的距离或间隔抽选样本单位。 • 排列顺序可用与调查项目有关的标志为依据,如在购买力调查中,按收入多少由低至高排列,也可用与调查项目无关的标志为依据,如按户口册、姓名比划的排列。

  25. 系统抽样的具体步骤是: • (1)给总体中的每一个个体按顺序编上号码,即制定出抽样框,这与简单随机抽样的作法一样; • (2)计算出抽样间距,方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式求得K=N/n • (3)在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称作随机的起点; • (4)在抽样框中,自A开始,每隔K个个体抽取一个个体。即所抽取个体的编号分别为 A,A+K,A+2K,…,A+(n-1)K; • (5)将这n个个体合起来,就构成了该总体的一个样本。

  26. [案例] • 要在一个村的110户农民中,用等距抽样方法抽10%的农户进行家庭收支情况调研,具体做法是: • 若按无关标志排队等距抽样,其做法只要根据村民户的花名册,用该村的全部村民户数除以预定的户数,即110/11=10,计算出抽样距离,然后每隔一个距离即10户抽1户进行调查。抽取调研单位的起点,可以从第一组1号到10号中随机抽出某号,譬如以7号为第一个调查单位,则这11个调查户应为第7户、第17户、第27户、…第107户。

  27. 使用系统抽样方法,应注意下列两种情况: • 一是总体名单中,个体的排列具有某种次序上的先后、等级上的高低的情况。 • 二是总体名单上,个体的排列上有与抽样间隔相对应的周期性分布的情况。 • 特点:方法简单,且能使样本均匀地分散在调查总体中,增加了样本的代表性。适用于大规模调查。

  28. 3、分层抽样 • 又称类型抽样,它是先将总体的所有单位某种特征或标志(如性别、年龄、职业或地域等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。

  29. 总体N=N1+N2+ …+Nn 层次N1 抽样n1 样本数 n= n1+n2 +…+nm 层次N2 抽样n2 … … 层次Nn 抽样nm

  30. 分层抽样图示 随机抽样 分类 总体 子群 样本

  31. (1)分层抽样方法的优点 • 1)分层抽样可以在不增加样本规模的前提下降低抽样误差,提高抽样的精度。因为采用分层抽样的最基本目的,是把异质性较强的总体分成一个个同质性较强的子总体,可以提高抽样效率,获得更好的抽样效果。 • 2)便于对总体中不同的层次或类别进行单独研究,或者进行比较。

  32. (2)在实际运用分层抽样的方法时,还需要考虑下列两个方面的问题:(2)在实际运用分层抽样的方法时,还需要考虑下列两个方面的问题: • 1)分层的标准问题,通常采用的原则如下: • A、以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 • B、以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。 • C、以那些已有明显层次区分的变量作为分层变量。

  33. 2)分层的比例问题 • 分层抽样中有按比例和不按比例分层两种方法 • 按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法(等比例分层抽样) • 每层抽取样本数计算公式为: • Sⅰ=(Nⅰ/N) ×S • 式中: Sⅰ表示第ⅰ层应抽取的样本数;N表示总体中含单位总数;Nⅰ表示第ⅰ层含单位总数;S表示应抽取样本总数。

  34. [案例] • 某省有1800个乡,其中山区540个,丘陵360个,平原720个,滨海180个,现要从中抽270个乡来进行农村经济调研,问如何确定各层调查乡数? • Sⅰ(山区) =(540/1800)×270=81个 • Sⅰ(丘陵) =(360/1800)×270=54个 • Sⅰ(平原) =(720/1800)×270=108个 • Sⅰ(滨海) =(180/1800)×270=27个

  35. 4、整群抽样 • 将调研的总体按一定的标准(如地区、单位)分为若干群,然后在其中随机抽取部分单位进行普查的方法。 • 整群抽样与分层抽样的区别: • (1)分层抽样强调各层彼此之间差异明显,且层内差异很小;而分群抽样强调各群彼此差异不大,而每群内部差异明显。 • (2)分层抽样每层都要按一定数目抽取样本,而分群抽样是抽总群中的若干群,抽出的群全部为样本。

  36. 集群一 集群六 集群二 集群七 集群八 集群三 集群四 … 集群五 集群n 母群体共分成n个集群 共抽取m个集群 集群一 母群体总数 集群三 … 集群m

  37. 划分子群 随机抽样

  38. 5、多段抽样 • 又称多级抽样或分段抽样,它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。 • 多段抽样具体做法是: • 先从总体中随机抽取若干大群,然后再从这几个大群内抽取几个小群,这样一层层抽下来,直至抽到最基本的抽样元素为止。

  39. 案例 尼尔森全国零研99 ’ 全国31个省市区 第一阶段 广东 山西 山东 河北 … 济南 烟台 威海 荣成 蓬莱 … 第二阶段 威海 蓬莱 济宁 枣庄 商店普查

  40. 如何确定每一级抽样的单位数目? • 需要考虑三大因素: • 一是各个抽样阶段中子总体同质性程度;二是各层子总体的人数; • 三是研究者的所拥有的人力和经费。 • 同等条件下减少多段抽样误差的方法是: • 相对增加开头阶段的样本数而适当减少最后阶段的样本数。

  41. 各种抽样方法优缺点比较

  42. 练习题: 某市有300所小学,共240000名学生。这些小学分布在全市5个行政区中。其中重点小学有30所,一般小学有240所,较差的小学有30所。现要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。请设计一种抽样方案。

  43. 万科青年群体居住形态研究 • 房地产市场已经开始从产品导向思维明显地向顾客导向诉求的方向不断地变化着,万科作为世界最大的房地产商和中国房地产市场的领头羊,更加关注顾客对于住房的细微需求,对已经置业人群在居住形态和使用房屋的行为习惯进行研究,无疑可以增进武汉万科未来项目产品设计的针对性。

  44. 三、非概率抽样方法 • 从调研对象总体中按调研者主观设定的某个标准抽取样本单位的调研方式。 偶遇抽样 雪球抽样 判断抽样 定额抽样

  45. 1、偶遇抽样 • 它又称作方便抽样或自然抽样。是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。 • 特点:针对性强 -快捷节省-误差难估 • 适用范围: • 探测性调查 • 总体同质性强 • 街头拦截式面访调查

  46. 2、判断抽样 • 又称立意抽样,研究人员凭主观意愿、经验和知识,从总体中选择具有典型代表性的样本作为调查对象 • 方法: • 专家判断 • 标准样本 • 特点:简单快捷 • 用途:多用于总体规模小、调查所涉及的范围较窄或调查时间、人力等条件有限而难以进行大规模抽样的情况。

  47. 3、定额抽样 • 又称为配额抽样,是按照一定标准,分配样本数额,并在规定数额内由调查人员任意抽选样本的方法。 • 具体做法是: • 研究者要尽可能地依据那些有可能影响研究变量的各种因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例。然后依据这种划分以及各类成员的比例去选择调查对象,使样本中的成员在上述各种因素、各种特征方面的构成和在样本的比例尽量接近总体的情形。

  48. 案 例 • 假设某高校有2000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生分别占30%、20%和10%。现要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。

  49. 100个人的定额样本分布表

  50. 定额抽样与分层抽样的区别 • 一、抽取方法不同 • 分层抽样依据概率原则到各层中进行抽样;而定额抽样则是通过主观的分析来确定和选择组成这种模拟物的成员。 • 二、目的不同 • 定额抽样注重样本与总体在结构比例上的表面上的一致性;而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减少。

More Related