500 likes | 662 Views
第七章 假设检验. 我们在第一章就已经知道,推论统计有两个基本 内容:①假设检验;②参数估计。有了概率和概率分 布的知识,接下来我们要逐步掌握统计检验的一般步 骤。既然按照数学规则得到的概率都不能用经验方法 准确求得,于是,理论概率和经验得到的频率之间肯 定存在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不 同。本章我们不仅要引出二项分布和正态分布这两个 著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面。. 第一节 二项分布.
E N D
第七章 假设检验 我们在第一章就已经知道,推论统计有两个基本 内容:①假设检验;②参数估计。有了概率和概率分 布的知识,接下来我们要逐步掌握统计检验的一般步 骤。既然按照数学规则得到的概率都不能用经验方法 准确求得,于是,理论概率和经验得到的频率之间肯 定存在某种差别,这就引出了实践检验理论的问题。 随机变量的取值状态不同,其概率分布的形式也就不 同。本章我们不仅要引出二项分布和正态分布这两个 著名的概率分布,并且要将它们与抽样调查联系起 来,以领会统计检验,并逐步拓宽其应用面。
第一节 二项分布 二项分布是从著名的贝努里试验中推导而来。所谓 贝努里试验,是指只有两种可能结果的随机试验。在实际 问题中,有许多随机现象只包含两个结果,如男与女,是 与非,生与死,同意与不同意,赞成与反对等等。通常, 我们把其中比较关注那个结果称为“成功”,另一个结果则 称为“失败”。每当情况如同贝努里试验,是在相同的条件 下重复n次,考虑的是“成功”的概率,且各次试验相互独 立,就可利用与二项分布有关的统计检验。虽然许多分布 较之二项分布更实用,但二项分布简单明了,况且其他概 率分布的使用和计算逻辑与之相同。所以要理解统计检验 以及它所涉及的许多新概念,人们几乎都乐意从二项分布 的讨论入手。
1. 二项分布的数学形式 从掷硬币的试验入手。假定二项试验由重复抛掷n次 硬币组成,已知硬币面朝上(成功)的概率是p,面朝下(失 败)的概率是q (显然有 q=1―p)。这样,对试验结果而 言,成功的次数(即硬币面朝上的次数)X是一个离散型 随机变量,它的可能取值是0,1,2,3,…,n。而对X的 一个具体取值x而言,根据乘法规则,我们立刻可以就试 验结果计算出一种特定排列方式(先x次面朝上,而后n―x 次面朝下)实现的概率,即 ppp…pqqq…q=pxqn-x
由于正确解决概率问题,光考虑乘法规则是 不够的,还要考虑加法规则,于是就x次成功和 (n―x)次失败这个宏观结果而言所包含的所有 排列的方式数,用符号表示 这样,我们就得到了二项试验中随机变量X的 概率分布,即
譬如,二项试验是将一枚硬币重复做8次抛掷,假设这枚硬币是无偏的,即 p=q=0.5,那么恰好得到5次面朝上的概率是 同理,我们也可以求出 这个二项试验中硬币刚好为 0,1,2,…,8次面朝上的 各种宏观结果的概率,全部 写出来就是右表。
2. 二项分布讨论 ① 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下n次重复的伯努利试验时,随机变量X共有n+1个取值。二项分布可以用分布律(见上表)和折线图(见右图)来表示。 ②当P=0.5时二项分布的图形是对称的。
③ E(X)=μ=np, D(X)= σ2= npq ④ 二项分布受 p 和 n 变化的影响,只要确定了 p和 n,成功次数 X 的分布也随之确定。因此,二项分布还可简写作 B(x; n,p)。 ⑤二项分布的概率值除了根据公式直接进行计算外,还可查表求得。二项分布表的编制方法有两种:一种依据概率分布律 P(x) 编制(见附表2);另一种依据分布函数 F(x) 编制(见附表3)。 其中
[例] 某特定社区人口的10%是少数民族,现随机 抽取6人,问其中恰好2人是少数民族的概率是多少? [解] 解法一:根据(7.3)式直接计算 解法二:根据附表2中纵列n=6和横行p=0.1所 对应x值,可直接查得B(x;6,0.1)的概率值 B (2;6,0.1)=0.0984 解法三:根据附表3求得 B (2;6,0.1)=F(2) ―F(3) = 0.1143―0.0159=0.0984
第二节 统计检验的基本步骤 二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到 概率分布是先验的理论分布这一点很重要,因为我们不禁要问,既然试 验或抽样调查的结果仅与随机变量可能取值中的一个相联系,那么实际 试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题? 具体来讲,对于一枚硬币被重复抛掷8次的二项试验,经验告诉我们,一 共有9种可能的结果,而且实现这些结果的机会是大不相同的。研究者实 际上从来不用经验的方法求得概率分布,因为通常我们只对一项试验进 行一次或几次,抽取样本也是一个或至多不过几个。既然二项分布是按 照数学规则得到的,那么对这9种结果的可能性我们应该作出何种评价呢? 如果实际试验(或抽样)得到的结果偏巧就是先验概率预示的最不可能 出现的结果,那么我们是认定纯属巧合,还是开始对用数学或演绎推理 方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说,在 一枚硬币被重复抛掷8次的这个二项试验中,究竟出现什么结果时,我们 应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4 次失败这个最大可能性结果就开始怀疑,还是仅当出现8次成功或一次也 不成功这两个极端情况时才产生怀疑呢?这就是统计检验的核心问题。
统计检验是指先建立一个关于总体情况的假设,继而抽取一个随机样本,然后以样本的统计量或者统计性质来检定假设。统计检验是指先建立一个关于总体情况的假设,继而抽取一个随机样本,然后以样本的统计量或者统计性质来检定假设。 • 大数定理表明:就大量观察而言,事件的发生具有一定的规律性。 • 根据概率的大小,人们处理的态度和方式很不一样。 • 在日常生活中,人们往往习惯于把概率很小的事件,当作一次观察中是极不可能看到的事件。例如,人们出门做事就有可能遇到不测事故,但却很少人因此而不敢出门。原因是:小概率事件极不可能发生。 统计检验的依据是 小概率原理:一是认为 小概率事件在一次观察 中是极少出现的;二是 如果在一次观察中出现 了小概率事件,那么应 该否定原有事件具有小 概率的说法或者假设。
根据以往多年的统计表明,上海财大英语的平均成绩为90分,随机抽取100个学生,其平均成绩为80分,问今年财大学生的英语成绩是否下降?根据以往多年的统计表明,上海财大英语的平均成绩为90分,随机抽取100个学生,其平均成绩为80分,问今年财大学生的英语成绩是否下降? 所所 包有含统 的计 步检 骤验 (1)建立假设 (4)计算检验统计量 (2)求抽样分布 (3)选择显著性水平和否定域 (5)判定
1.建立假设 统计检验是将抽样结果和抽样分布相对照而作出判 断的工作。取得抽样结果,依据描述性统计的方法就足 够了。抽样分布则不然,它无法从资料中得到,非利用 概率论不可。而不对待概括的总体和使用的抽样程序做 某种必要的假设,这项工作将无法进行。比如通过掷硬 币的实验得到二项分布,必须假设:①样本是随机的, 试验中各次抛掷相互独立;②硬币是无偏的(或称是诚 实的),即p=q=0.5。概括地说,必须首先就研究总 体和抽样方案都做出假设,再加上概率论,我们就可以 对各种可能结果做具体的概率陈述了。
2.求抽样分布 在做了必要的假设之后,我们就能用数学推理 过程来求抽样分布了。比如在这一章开头,在硬币重 复抛掷n次的理想实验中,我们计算了成功次数为x的 宏观结果所具有的概率,得到二项分布。如果前提假 设变动了,还可以求出其他形式的概率分布,如正态 分布、泊松分布、卡方分布等等,它们都有特定的方 程式。由于数学上已经取得的成果,实际上统计工作 者要做的这项工作往往并不是真的去求抽样分布的数 学形式,而是根据具体需要,确定特定问题的统计检 验应该采用哪种分布的现成的数学用表。
3.选择显著性水平和否定域 在统计检验中,那些不大可能的结果称为否定域。 如果这类结果真的发生了,我们将否定假设;反之就不 否定假设。 在统计检验中,通常把被检验的那个假设称为零假 设(用符号H0表示),并用它和其他备择假设(用符号 H1表示)相对比。 • 否定域 • 零假设与备择假设
两类错误及其关系 在统计检验中,无论是拒绝或者接受原假设,都不 可能做到百分之百的正确,都有一定的错误。第一类错 误是,零假设H0实际上是正确的,却被否定了。第二类 错误则是,H0实际上是错的,却没有被否定。 遗憾的是,不管我们如何选择否定域,都不可能完 全避免第一类错误和第二类错误,也不可能同时把犯两 类错误的危险压缩到最小。对任何一个给定的检验而 言,第一类错误的危险越小,第二类错误的概率就越 大;反之亦然。一般来讲,不可能具体估计出第二类错 误的概率值。第一类错误则不然,犯第一类错误的概率 是否定域内各种结果的概率之和。
显著性水平α 被我们事先选定的可以犯第一类错误的概率, 叫做检验的显著性水平(用α表示),它决定了否定 域的大小。因此,有人也把第一类错误称之α错 误 。相应地第二类错误被人称为 错误。 在原假设成立的条件下,统计检验中所规定的 小概率标准一般取为α=0.05或α=0.01。 由α所决定的否定域与接受域之间的分界值被 称为临界值, 如Z α 。 如果抽样分布是连续的,否定域可以建立在想 要建立的任何水平上,否定域的大小可以和显著性 水平的要求一致起来(后面的正态检验就如此)。 如果抽样分布是非连续的,就要用累计概率的方法 找出一组构成否定域的结果。
在统计中,必须把否定域分配到抽样分布的两端的检验,被称为双侧检验。在统计中,必须把否定域分配到抽样分布的两端的检验,被称为双侧检验。 • 双侧检验和单侧检验 根据否定域位置 的不同,可以将假设 检验分为双侧检验和 单侧检验。 • 在统计中,可以事先能预测偏差方向,因而可以把否定域集中到抽样分布更合适的一端的检验,被称为单侧检验。
在同样显著性水平的条件下,单侧检验比双侧检在同样显著性水平的条件下,单侧检验比双侧检 验更合适。因为否定域被集中到抽样分布更合适的一 侧,这样在犯第一类错误的危险不变的情况下,减少 了犯第二类错误的危险。 奈曼—皮尔逊 (Neyman—Pearson)提出了一个 原则 “在控制犯第一类错误的概率不超过指定值的 条件下, 尽量使犯第二类错误小”按这种法则做出的 检验称为“显著性检验”, 称为显著性水平或检验 水平。
4.计算检验统计量 在完成了上述工作之后,接下来就是做一次与理想试验 尽量相同的实际抽样(比如实际做一次重复抛掷硬币的试验), 并从获取的样本资料算出检验统计量。检验统计量是关于样本 的一个综合指标,但与我们后面参数估计中将要讨论的统计量 有所不同,它不用作估测,而只用作检验。 5.判定 假设检验系指拒绝或保留零假设的判断,又称显著性检 定。在选择否定域并计算检验统计量之后,我们完成最后一道 手续,即根据试验或样本结果决定假设的取与舍。如果结果落 在否定域内,我们将在已知犯第一类错误概率的条件下,否定 零假设。反之,如果结果落在否定域外,则不否定零假设,与 此同时,我们就有了犯第二类错误的危险。
[例] 若想通过抛掷10次硬币的实验来检验这个硬 币无偏的零假设,通过双侧检验0.10显著性水平,请 指出否定域。如果单侧检验(p<0.5),又将如何? [例] 某选区有选民10000人,其中属于工贸系统 的有4000人,要产生代表6名。假定各系统选民都有 同等机会当选代表,(1)代表是工贸系统人员的概 率分布;(2)在6名代表中最可能是工贸系统人员占 几名;(3)如果6名代表中有4名是工贸系统的人 员,可以否定随机性的零假设吗?(α=0.05,单侧检 验,p>0.4)
第三节 正态分布 • 如果说二项分布是离散型随机变量最具典型意义 的概率分布,那么连续型随机变量最具典型意义的概率 分布就是正态分布了。一般地讲,若影响某一变量的随 机因素很多,而每个因素所起的作用不太大且相互独 立,则这个变量服从正态分布。更为重要的是,不论总 体是否服从正态分布,只要样本容量n足够大,样本平 均数的抽样分布就趋于正态分布。 • 正态分布是最重要的概率分布:(1)许多自然现 象和社会现象,都可用正态分布加以叙述;(2)当样 本足够大时,都可用正态近似法解决变量的概率分布问 题;(3)许多统计量的抽样分布呈正态分布。
1. 正态分布的数学形式 正态分布性质: (1)正态曲线以x=μ呈钟型对称 均值=中位数=众数 (2)在x=μ处,概率密度最大;当区间离 μ越远,x落在这个区间的概率越小。
(3)正态曲线的外形由σ值确定。对于固定的 σ值,不同均值μ的正态曲线的外形完全相同,差别 只在于曲线在横轴方向上整体平移了一个位置 。 (4)对于固定的 μ值,改变σ值,σ 值越小,正态曲线越 陡峭;σ值越大,正 态曲线越低平。 (总之,正态分布曲线 的位置是由μ决定的,而正态 分布曲线的“高、矮、胖、瘦” 由σ决定的。) (5)E(X)= μ D(X)= σ2
2. 标准正态分布 Z分数(标准正态变量) 用Z分数表达的标准正态分布,其概率密度为 一般正态分布的表示 标准正态分布的表示
3. 正态曲线下的面积 但积分毕竟太麻烦了,更何况许多人对积分运算不熟悉,为 此须计算出现成的数值表供使用者查找。由于正态曲线的优良性 质,这项工作可以卓有成效地完成:①经过X的标准分 ,可以将任何正态分布N(μ,σ2)转换成标准正态分布 N(0,1);②运用分布函数的定义,并利用正态曲线的对称性,通 过下式(分布函数)可以计算编制出正态分布表(见附4)。
采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计算总体单位分布及其标志值变异范围的主要依据,下图说明了这一点。采用标准正态变量表达正态分布,使标准差得到了进一步阐明。我们看到,标准差是计算总体单位分布及其标志值变异范围的主要依据,下图说明了这一点。 • (1)变量值在【 μ-σ,μ+σ 】之间的概率为0.6826。 • (2)变量值在【 μ-2σ,μ+2σ 】之间的概率为0.9546。 • (3)变量值在【 μ-3σ,μ+3σ 】之间的概率为0.9973。
总之,决定任意两点间的面积都完全是可能的。比如向均值两侧移1.96个标准差,曲线下方便包含了大约95%的面积;如移动2.58个标准差,则面积几乎是99%。附录4已编制了关于Z和标准正态曲线所含面积之间关系的精确数值表,即Z从0到+∞变化,相应区间含的面积从0变至0.5。总之,决定任意两点间的面积都完全是可能的。比如向均值两侧移1.96个标准差,曲线下方便包含了大约95%的面积;如移动2.58个标准差,则面积几乎是99%。附录4已编制了关于Z和标准正态曲线所含面积之间关系的精确数值表,即Z从0到+∞变化,相应区间含的面积从0变至0.5。 [例] 设随机变 量X服从正态分布 N(168,12²),试求 P(X≤143)。
4. 二项分布的正态近似法 通过前面的讨论,我们已经知道二项分布受成功事件概率p和重复次数n两个参数的影响,只要确定了p和n,二项分布也随之确定了。 但是,二项分布的应用价值实际上受到了n的很大限制。也就是说,只有当n较小时,我们才能比较方便地计算二项分布。所幸的是,二项分布是以正态分布为极限的。所以当n很大时,只要p或q不近于零,我们就可以用正态近似来解决二项分布的计算问题。即以n p=μ、n p q=σ2,将B(x;n,p)视为N(n p,n pq)进行计算。在社会统计中,当n ≥30,n p、nq均不小于5时,对二项分布作正态近似是可靠的。
第四节 中心极限定理 一旦统计的学习进入到推论统计,我们就必须同时与三 种不同的分布概念打交道,即总体分布、样本分布、抽样分 布。为了不产生混淆,视分布不同,将统计指标的符号加以区 别是完全必要的。对那些反映标志值集中趋势和离中趋势的综 合指标,尤其对均值和标准差(或方差)。 在一个总体中可以产生无数个样本,所以样本统计量(比如均值 )必定是随机变量。 这样就提出一个问题:如果样本统计量作为随机变量,它的概率分布是什么样呢? 抽样分布特指样本统计量作为随机变量的概率分布。用数学语言来说,抽样分布是运用数理统计的方法,把具体概率赋予样本的所有可能结果的一种理论分布。
[解] 已知μ=168,σ=12 z 是负值,表示X的取值处于均值左边。由于曲线 完全对称,所以使用正态分布表时可以忽略 z 的正负号。 查表可知,正态曲线在均值与z=2.08之间所含面积是 0.4812。由于总面积的一半是0.5,因P(X≤143)可以由 下面计算求得 P(X≤143)=0.5―P(0≤Z≤2.08) =0.5―0.4812 =1.88% 这说明,X的取值小于或等于143的概率大约是2%。 由于即将讨论的正态检验几乎都要涉及概率分布的尾端, 所以此例说明的是一个非常普遍的问题。
1.中心极限定理 我们知道,概率论中用来阐明大量随机现象平均 结果的稳定性的定理,是著名的大数定理。其具体内 容是:频率稳定于概率,平均值稳定于期望值。但 是,大量随机现象的稳定性不仅表现在平均结果上, 同时也表现在分布上,这就是中心极限定理所要阐明 的内容。显然,推论统计需要有一座能够架通抽样调 查和抽样分布的桥梁。中心极限定理告诉我们:如果 从任何一个具有均值μ和方差σ2的总体(可以具有任 何分布形式)中重复抽取容量为n的随机样本,那么当 n变得很大时,样本均值的抽样分布接近正态,并具 有均值μ和方差 。
无疑,中心极限定理大大拓展了正态分布的适用面,同时我们得到了以下重要信息: (1)虽然样本的均值可能和总体均值有差别,但我们可期望这些将聚集在μ的周围。因此均值抽样分布的算术平均数能和总体的均值很好地重合,这就是为什么总体均值和抽样分布的均值用同一个μ来表示的缘故。 (2)由于抽样分布的标准 差要比总体标准差小,并且 ,所以如右图所 示,样本容量越大,抽样分 布的峰态愈陡峭,由样本结 果来推断总体参数的可靠性 也随之提高。
统计检验应用正态分布和二项分布有两点区别:①抽样分布统计检验应用正态分布和二项分布有两点区别:①抽样分布 在这里是连续的而非离散的,否定域的大小可以和显著性水平的 要求精确地一致起来。②计算检验统计量不再像在应用二项分布 时那样,可以不劳而获了。很显然,为了能使用现成的正态分布 表,关键是要从样本资料中计算出在N(0,1)形式下的统计量Z, 再根据Z是否落在否定城内而对被检验假设的取舍作出决定。 在上一节我们曾引出 。Z 的这种形式适用于 N(μ,σ2)的总体,但并不适用于取正态的抽样分布。正如我们 反复强调的那样,统计检验单纯依靠样本自身是得不出结果的, 必须首先在一系列假设的基础上求出抽样分布。如果这些假设实 际上正确,那么抽样分布将告诉我们得到一个给定的的可能性是 多少。在抽样分布中,随机变量的取值是每个 ,均值是μ, 标准差是 。因此 Z 如果作为检验统计量,应该用 替换X,用 替换σ,μ不动,因而有 。
一个完整的假设应该包括零假设和备 择假设。在Z检验中,假设有三种写法: • 第一种:H0: μ =90 H1: μ≠ 90 • 第二种:H0: μ =90 H1: μ<90 • 第三中:H0: μ =90 H1: μ >90 双侧检验 单侧检验(左) 单侧检验(右)
思考题 • 1.如何理解两类错误及其关系? • 2.如何理解小概率原理在假设检验中的重要性? • 3.假设检验的基本原理和步骤是什么? • 4.什么是原假设域备择假设? • 5.如何理解双侧检验与单侧检验?
第五节 总体均值和成数的单样本检验 [例] 一位研究者试图检验某一社会调查所运用 的抽样程序,该项调查是由一些缺乏经验的访问员进 行的。研究者怀疑属于干部和知识分子的家庭抽得过 多。过去的统计资料表明,该街区的家庭收入是7500 元,标准差是1500元;此次调查共抽取100个家庭,样 本平均收入是7900元。问:该研究人员是否有理由怀 疑该样本有偏估?(选用α=0.05) 1.σ已知,对总体均值的检验 实际上是要检验“随机抽样”这个零假设
[解] 根据题意,可做如下假设,并做单侧检验 因α=0.05,查表得Z 0.05=1.65,故否定域为 根据中心极限定理,检验统计量 计算得 检验统计量Z的计算表明,样本均值比总体均值大2.67个 标准差( ),超过了显著性水平规定的临界值,调查者应该 否定“随机抽样”的零假设。也就是说,由于抽样在程序上不合要 求,这项社会调查有必要重新组织。
中心极限定理实际解决了大样本均值的检验问 题。假定样本比较大(n>50,这在社会调查中一般 都能得到满足),样本均值的抽样分布就与总体分布 无关,而服从正态分布。当H0成立时,样本均值的 观察值比较集中地分布在总体均值μ周围;当H0不 成立时, 将对μ有明显偏离的趋势。因而,我们 可以在选定的显著性水平上,通过计算检验统计量 Z,对零假设进行检定。 注:当σ未知时,只要样本量很大,就可用S 来代替σ 。但对于小样本,Z检验就要用 t 检验来 替代了,而且还必须严格限于正态总体。
[例] 某单位统计报表显示,人均月收入为2330元,为了验证 该统计报表的正确性,作了共81人的抽样调查,样本人均月收入 为2350元,标准差为150元,问能否说明该统计报表显示的人均 收入的数字有误(取显著性水平α=0.05)。 [解] 根据题意,可作如下的假设,并做双侧检验 H0:μ=2330元 H1:μ≠2330元 因α=0.05,查正态分布表得Zα/2=1.96,故否定域|Z|≥1.96 计算检验统计量 Z= ≈ = =1.20<1.96 所以,不能认为该单位人均月收入不是2330元,即不能 认为该统计报表有误。 此乃“总体均值”零假设的检验
这个统计量最初是由戈塞特(1876一1937)用笔名“学生”发表,所以这个统计量的抽样分布称为学生t分布。比较t和Z,我们注意到它们的分子相同,而分母却稍有不同:①σ为S所代替(这一点无须解释);②根号下是n―1。这个统计量最初是由戈塞特(1876一1937)用笔名“学生”发表,所以这个统计量的抽样分布称为学生t分布。比较t和Z,我们注意到它们的分子相同,而分母却稍有不同:①σ为S所代替(这一点无须解释);②根号下是n―1。 2.小样本总体均值的检验(学生t分布) 中心极限定理解决了大样本均值的检验问题。但是 当n较小时,用这种方法求出的概率可能是错误的,有 必要做某种修正。于是有人设计了另一种检验统计量
采用n―1的原因:样本数据的离散程度小于总体数据的离散程度。 n―1实际为自由度数k 。 当Z为t替代时,虽用因子n—1所导致的修正看起 来不大,但在样本容量较小时,这种修正就会起很大 作用了。所以当不知道σ值、且样本容量较小时,我 们应该考虑应用t分布而不是Z分布。
通过下式可以编制出t 分布表(见附录5) 注意tα(k)写法的含义,它表示自由度数为k的t分布当分布函数 时随机变量t的临界值。当n变大,t 分布将越来越接近正态分布,应用t分布还是Z分布就无所谓了。事实上随着n变大,S逐渐变成σ的精确估计量,因而分母项无论使用S还是σ,差别都非常小。但特别要留意,使用t 分布的条件比使用Z分布的条件苛刻,即必须假定总体为正态。
[例] 已知初婚年龄服从正态分布。根据10人的调 查有 = 23.5岁,S=3岁,问是否可以认为该地区的平 均初婚年龄已超过20岁?(α=0.01) [解] H0:=20;H1:>20 因为n小,又不知σ值,因此用t检验 对自由度9来讲,单侧检验和显著性水平0.01,查 表知否定域为t值等于或大于 2.821。再计算检验统计量 因此拒绝H0,即可以认为在显著性水平为0.01的条件下,该地区的初婚年龄已超过20岁。
3.大样本成数的检验 有时需要对总体中具有某种特征的单位在总体中 所占的的比例 p(即总体成数)作显著性检验,如人口 中的失业率、学龄儿童中的失学率等等。成数检验与二 项检验的联系是不言而愈的。因为在二项检验中,随机 变量是样本的“成功”次数x。而在成数检验中,随机变 量是样本的“成功”比例 (即样本成数),这样在 n 一 定的情况下,显然有
既然 是一个随机变量,那么把具体概率赋予样本成数的每一个取值,我们就得到了样本成数的抽样分布。根据中心极限定理,我们不难想见,当n足够大时,样本成数的抽样分布也服从正态分布。由于数学 上很容易证明 , ,这样一来,对于大样本(n≥30,np≥5),成数的检验统计量 Z 可表示为
[例] 某地区成年男性中吸烟者占64%,经过戒烟宣传后进行抽样调查,发现100名被调查者中,有55人是吸烟者,试问戒烟宣传是否有成效(α=0.05) [解] 已知n=100>30,np=l00×0.64=64>5,故可使用 正态检验。又知 =0.55,p=0.64,q=0.36,则 H0: p=0.64 H1: p<0.64 据题意,选择单侧检验,因α=0.05,查正态分布表得否定域为 |Z|≥1.65。再计算检验统计量 因此,否定零假设,即认为戒烟宣传收到了显著成效。
练习: 1. 为了检验统计报表的正确性,作了共50人的抽 样调查,人均收入为871元,标准差为21元,问能否证 明统计报表中人均收入880元是正确的? (α=0.05) 2. 许多人在周末睡懒觉以弥补工作日的睡眠不 足。最佳睡眠协会的报告说,我们之中有61%的人在周 末每夜睡眠多于7小时。从350个成年人的一组随机样本 发现235人在上周末有多于7小时的睡眠。以0.05的显著 水平,这证据证明有61%以上该周末每夜多于7小时的 睡眠吗? 3. 原有的研究表明,上海家庭中不和的占30%。从 上海随机抽取20名户家庭,调查得出20%的家庭不和。 问能否得出上海家庭关系改善的结论? (α=0.05)
4.一家保险公司说,客户索赔的90%在30天以内 办好。为检验公司的这种说法,消协选取了75次公司 索赔的一组随机样本,发现55次索赔在30天内办好, 他们有充分理由支持“在30天内办好索赔小于90%”的 论点吗?( α=0.05) 5. 通过试管受精(IVF)怀孕的第一个婴儿1978年 在英格兰出生。在此后的20年间,1000万妇女因为不 育接受了这种护理,这种方法的平均成功率为22.5%, 但是随着技术的不断进步,其成功率还在不断上升。 假定使用IVF方法企图克服不育的200个妇女的一项最 新研究证明,61个是成功怀孕的。此结果证明样本的 成功率比基于历史成功率所期望的更大吗( α=0.05)
6. 某研究员为证实知识分子家庭的平均子 女数低于工人家庭的平均子女数(2.5人), 随机抽取了100户知识分子家庭进行调查,发 现,平均子女数为2.1人,标准差为1.1人,上 述看法能否得以证实?(α=0.05) • 7. 据原有资料,某城市居民彩电的拥有率 为60%,现根据最新100户的抽样调查,彩电 的拥有率为62%。问能否认为彩电拥有率有所 增长?(α=0.05)