第三章区间估计与假设检验

第三章区间估计与假设检验 • 3.1 区间估计与假设检验的基本概念 • 3.2 总体均值的区间估计与假设检验的SAS实现 • 3.3 总体比例的区间估计与假设检验的SAS实现 • 3.4 总体方差的区间估计与假设检验的SAS实现 • 3.5 分布检验

3.1 区间估计与假设检验的基本概念 • 3.1.1 区间估计 • 3.1.2 假设检验

3.1.1 区间估计 • 1. 点估计和区间估计 • 参数的估计方法主要有两种：点估计和区间估计。 • 点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性，不同样本观测值计算得出的参数的估计值间存在着差异，因此常用一个区间估计总体的参数，并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值，计算得出参数的置信区间的方法称为参数的区间估计。

2. 参数的置信区间 • 在区间估计中，对于总体的未知参数θ，需要求出两个统计量θ1(X1，X2，...，Xn)和θ2(X1，X2，...，Xn)来分别估计总体参数θ的上限和下限，使得总体参数在区间（θ1，θ2）内的概率为 • P{θ1 <θ <θ2} = 1 – α • 其中1 – α称为置信水平，而(θ1，θ2)称为θ的置信区间，θ1,θ2分别称为置信下限和置信上限。置信水平为1 – α的含义是随机区间(θ1，θ2)以1 – α的概率包含了参数θ。

3. 正态总体均值和方差的置信区间 • 参数的区间估计大多是对正态总体的参数进行估计，如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。 • 正态总体参数的各种置信区间见表3-1。

正态总体参数的各种置信区间见表3-1。 其中

4. 总体比例与比例差的置信区间 • 实际应用中经常需要对总体比例进行估计，如产品的合格率、大学生的就业率和手机的普及率等。记π和P分别表示总体比例和样本比例，则当样本容量n很大时（一般当nP和n(1 – P)均大于5时，就可以认为样本容量足够大），样本比例P的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表3-2所示。

3.1.2 假设检验 • 1. 假设检验的基本原理 • 对总体参数进行假设检验时，首先要给定一个原假设H0，H0是关于总体参数的表述，与此同时存在一个与H0相对立的备择假设H1，H0与H1有且仅有一个成立；经过一次抽样，若发生了小概率事件（通常把概率小于0.05的事件称为小概率事件），可以依据“小概率事件在一次实验中几乎不可能发生”的理由，怀疑原假设不真，作出拒绝原假设H0，接受H1的决定；反之，若小概率事件没有发生，就没有理由拒绝H0，从而应作出拒绝H1的决定。

2. 假设检验的步骤 • 1) 根据问题确立原假设H0和备选假设H1； • 2) 确定一个显著水平，它是衡量稀有性（小概率事件）的标准，常取为0.05； • 3) 选定合适的检验用统计量W（通常在原假设中相等成立时，W的分布是已知的），根据W的分布及的值，确定H0的拒绝域。 • 4) 由样本观测值计算出统计量W的观测值W0，如果W0落入H0的拒绝域，则拒绝H0；否则，不能拒绝原假设H0。

注意：在SAS系统中，是由样本观测值计算出统计量W的观测值W0和衡量观测结果极端性的p值（p值就是当原假设成立时得到样本观测值和更极端结果的概率），然后比较p和作判断：p < ，拒绝原假设H0；p，不能拒绝原假设H0。

p值通常由下面公式计算而得到。 • ● p = P{|W| ≥ |W0|} = 2 P{ W ≥ |W0|} • （拒绝域为两边对称的区域时） • ● p = min{P{W ≥ W0}，P{WW0}} • （拒绝域为两边非对称区域时） • ● p = P{W ≥ W0} （拒绝域为右边区域时） • ● p = P{WW0} （拒绝域为左边区域时） • 只需根据SAS计算出的p值，就可以在指定的显著水平下，作出拒绝或不能拒绝原假设的决定。

3. 正态总体均值和方差的假设检验 • 对正态总体的参数进行假设检验是假设检验的重要内容，如对单总体均值、方差的检验、两总体均值之差的检验和两总体方差比的检验等。正态总体参数的各种检验方法见下表3-3至表3-5。 • 表3-3 单正态总体N(μ,2)均值μ的检验法

表3-4 单正态总体N(μ,2)方差2的检验法 或

表3-5 两正态总体的均值差与方差比的检验

4. 总体比例与比例差的检验 • 当样本容量n很大时，可根据表3-6对总体比例与比例差进行假设检验。 • 表3-6 总体比例与比例差的检验

3.2 总体均值的区间估计与假设检验的SAS实现 • 3.2.1 使用INSIGHT模块 • 3.2.2 使用“分析家” • 3.2.3 使用TTEST过程

3.2.1 使用INSIGHT模块 • 1. 总体均值的区间估计 • 【例3-1】某药材生产商要对其仓库中的1000箱药材的平均重量进行估计，药材重量的总体方差未知，随机抽取16箱样本称重后结果如表3-7所示。 • 表3-7 16箱药材重量（单位：千克） • 设药材重量数据存放于数据集Mylib.yczl中，其中重量变量名为weight。求该仓库中每箱药材平均重量在95%置信水平下的置信区间。

步骤如下： • 1) 启动INSIGHT模块，并打开数据集Mylib.yczl； • 2) 选择菜单“Analyze”→“Distribution(Y)”； • 3) 在打开的“Distribution(Y)”对话框中进行区间估计的设置（如图）。

结果包括一个名为“95％Confidence Intervals（95%置信区间）”的列表，表中给出了均值、标准差、方差的估计值（Parameter）、置信下限（LCL）和置信上限（UCL），如图3-2所示。结果表明，根据抽样样本，该仓库中药材的平均重量以95%的可能性位于50.08千克至52.92千克之间。

2. 单样本总体均值的假设检验 • 【例3-2】一家食品厂以生产袋装食品为主，每天的产量大约为8000袋，每袋重量规定为100克。为了分析每袋重量是否符合要求，质检部门经常进行抽检。现从某天生产的一批食品中随机抽取了25袋，测得每袋重量如表3-8所示。 • 表3-8 25袋食品的重量（单位：克） • 试从抽检的样本数据出发，检验变量WEIGHT的均值与100克是否有显著差异。假定表3-8数据存放在数据集Mylib.spzl中，重量变量名为WEIGHT。

设变量WEIGHT的均值为μ，问题是希望通过样本数据检验变量WEIGHT均值的如下假设：设变量WEIGHT的均值为μ，问题是希望通过样本数据检验变量WEIGHT均值的如下假设： • H0：μ = 100， H1：μ 100。 • 使用INSIGHT对均值进行检验的步骤如下： • 1) 首先启动INSIGHT，并打开数据集Mylib.spzl； • 2) 选择菜单“Analyze”→“Distribution(Y)”； • 3) 在打开的“Distribution(Y)”对话框中选定分析变量WEIGHT； • 4) 单击“OK”按钮，得到变量的描述性统计量；

5) 选择菜单“Tables（表）”→“Tests for Location（位置检验）”；在弹出的“Tests for Location”对话框中输入100，单击“OK”按钮得到输出结果如图所示。

结果显示，观测值不等于100克的观测有24个，其中19个观测值大于100。结果显示，观测值不等于100克的观测有24个，其中19个观测值大于100。 • 图中第一个检验为t检验(Student's t)，需要假定变量服从正态分布，检验的p值为0.0105，这个检验在0.05水平下是显著的，所以可认为均值与100克有显著差异。第二个检验(Sign)是叫做符号检验的非参数检验，其p值为0.0066，在0.05水平下也是显著的，结论不变。第三个检验(Sgned Rank)是叫做符号秩检验的非参数检验，其p值为0.0048，在0.05水平下是显著的，结论不变。

3. 两样本总体均值的比较：成对匹配样本 • 在INSIGHT中比较成对样本均值是否显著差异，可以计算两变量的差值变量，再检验差值变量的均值是否显著为0。 • 【例3-3】由10名学生组成一个随机样本，让他们分别采用A和B两套试卷进行测试，结果如表3-9所示。 • 表3-9 10名学生两套试卷的成绩 • 试从样本数据出发，分析两套试卷是否有显著差异。

步骤如下： • 1) 首先生成差值变量： • 启动INSIGHT，并打开数据集Mylib.sjdf。选择菜单“Edit”→“Variables”→“Other”，打开“Edit Variables”对话框，选择A为Y变量，B为X变量，然后选择变换（Transformation）：Y – X，如图，生成新的差值变量d；

2) 然后对变量d的均值做如下假设： • H0：μd = 0， H1：μd 0。 • 3) 选择菜单“Analyze”→“Distribution(Y)”；在打开的“Distribution(Y)”对话框中选定分析变量：选择变量差值d，单击“Y”按钮，将变量d移到右上方的列表框中； • 4) 单击“Output”按钮，在打开的对话框中选中“Tests for Location（位置检验）”复选框； • 5) 两次单击“OK”按钮，得到变量的描述性统计量；

6) 选择菜单“Tables（表）”→“Tests for Location（位置检验）”；在弹出的“Tests for Location”对话框中输入0，单击“OK”按钮得到输出结果如图所示。 • 结果显示三个检验的结论都是p值小于0.05，所以应拒绝原假设，即总体的均值与0有显著差异。所以两套试卷有显著差异。 • 虽然SAS给出三个检验结果，其实作结论时只需其中一个。如果可以认为分析变量服从正态分布只要看t检验结果；否则只须看符号秩检验结果。只有在数据为两两比较的大小结果而没有具体数值时符号检验才有用。

3.2.2 使用“分析家” • 1. 总体均值的置信区间 • 【例3-4】在“分析家”中求例3-1中每箱药材平均重量在95%置信水平下的置信区间。 • 步骤如下： • 1) 在“分析家”模块中打开数据集Mylib.yczl； • 2) 选择菜单“Statistics（统计）”→“Hypothesis Tests（假设检验）”→“One Sample t – test for a Mean（单样本均值t - 检验）”； • 3) 在打开的“One Sample t – test for a Mean”对话框中设置均值的置信区间（如图3-6）。

3) 在打开的“One Sample t – test for a Mean”对话框中设置均值的置信区间（如图3-6）。 • 结果表明（下图），根据抽样样本，该仓库中药材的平均重量以95%的可能性位于50.08千克至52.92千克之间。

2. 单样本总体均值的假设检验 • 【例3-5】使用“分析家”检验例3-2中食品重量是否符合要求。希望通过样本数据检验变量WEIGHT均值的如下假设： • H0：μ = 100， H1：μ 100。 • 由于此时的方差未知，所以使用t检验法。步骤如下： • 1) 在“分析家”中打开数据集Mylib.spzl； • 2) 选择菜单“Statistics（统计）”→“Hypothesis Tests（假设检验）”→“One Sample t – test for a Mean（单样本均值t - 检验）”，打开“One Sample t – test for a Mean”对话框；

4)按图3-8所示设置均值检验，单击“OK”按钮，得到结果如图左所示。； • 显示结果（图右）表明t统计量的p值为0.0105<0.05，所以拒绝原假设，即认为总体的均值不等于100。

3. 两样本总体均值的比较：成对匹配样本 • 【例3-6】使用“分析家”对例3-3中两套试卷检验有无显著差异。 • 这是一个（成对匹配）双样本均值检验问题，若μ1和μ2分别表示两套试卷的平均成绩，则检验的是： • H0：μ1 – μ2 = 0， H1：μ1 – μ2 0； • 分析步骤如下： • 1) 在“分析家”中打开数据集Mylib.sjdf； • 2) 选择菜单“Statistics（统计）”→“Hypothesis Tests（假设检验）”→“Two Sample Paired t - Test for a Mean（均值的成对双样本t - 检验）”；

3) 在打开的“Two Sample Paired t - Test for a Mean”对话框中，按图左所示设置双样本均值检验，单击“OK”按钮，得到结果如图右所示 • 结果显示，无论两总体的方差是否相等，t统计量的p值 = 0.0005 < 0.05，所以在95%的置信水平下，拒绝原假设，两总体的均值有显著差异。 • 结果表明可以95%的把握认为两套试卷有显著差异。

4. 两样本总体均值的比较：独立样本 • 【例3-7】为估计两种方法组装产品所需时间的差异，分别对两种不同的组装方法各随机安排一些个工人进行操作试验，每个工人组装一件产品所需的时间如表3-10所示。试以95%的置信水平推断两种方法组装产品所需平均时间有无差异。 • 表3-10 两种方法组装产品所需的时间（单位：分钟） • 这是一个（独立）两样本均值检验问题，若μ1和μ2分别表示两种方法组装一件产品所需的平均时间，则检验的是：H0：μ1 – μ2 = 0，H1：μ1 – μ2 0；

假定表3-10数据存放在数据集Mylib.zzcpsj中，将两个样本中被比较均值的变量的观测值记在同一分析变量F下，不同的样本用一个分类变量g的不同值加以区分，而且分类变量g只能取两个值，否则无法进行。假定表3-10数据存放在数据集Mylib.zzcpsj中，将两个样本中被比较均值的变量的观测值记在同一分析变量F下，不同的样本用一个分类变量g的不同值加以区分，而且分类变量g只能取两个值，否则无法进行。 • 分析步骤如下： • 1) 在“分析家”中打开数据集Mylib.zzcpsj； • 2) 选择菜单“Statistics（统计）”→“Hypothesis Tests（假设检验）”→“Two Sample t - Test for Mean（两样本均值的t - 检验）”；

3) 在打开的“Two Sample t - Test for a Mean”对话框中，按图3-12所示设置双样本均值检验，单击“OK”按钮，得到结果如图3-13所示 • 结果显示，由于t统计量的p值 = 0.0433，所以在95%的置信水平下，应该拒绝原假设，即两种方法所需时间有差异。表明有95%的把握认为两种方法所需时间有差异。

3.2.3 使用TTEST过程 • TTEST过程可以执行单样本均值的t检验、配对数据的t检验以及双样本均值比较的t检验。 • 1. 语法格式 • PROC TTEST <选项列表>； • [CLASS <分组变量名>；] • [VAR <分析变量名列表>；] • [PAIED <变量名列表>；] [BY <分组变量名>；] • RUN； • 其中，PROC TTEST和RUN语句是必须的，其余语句都是可选的，而且可调换顺序。

CLASS语句所指定的分组变量是用来进行组间比较的；而BY语句所指定的分组变量是用来将数据分为若干个更小的样本，以便SAS分别在各小样本内进行各自独立的处理。 • VAR语句引导要检验的所有变量列表，SAS将对VAR语句所引导的所有变量分别进行组间均值比较的t检验。

PAIED语句用来指定配对t检验中要进行比较的变量对，其后所带的变量名列表一般形式及其产生的效果见表3-11。 • 表3-11 选项及其含义

PROC TTEST语句后可跟的选项及其表示的含义如表3-12所示。 • 表3-12 选项及其含义

2. 总体均值的置信区间 • 【例3-8】仍然考虑例3-3中的样本数据。假定其中数据使用如下数据步存放在数据集sjcj中，两套试卷得分的变量名分别为A和B。 • data sjcj; • input A B@@; • cards; • 78 71 63 44 72 61 89 84 91 74 • 49 51 68 55 76 60 85 77 55 39 • ; • run;

【例3-8】仍然考虑例3-3中的样本数据。假定其中数据使用如下数据步存放在数据集sjcj中，两套试卷得分的变量名分别为A和B。【例3-8】仍然考虑例3-3中的样本数据。假定其中数据使用如下数据步存放在数据集sjcj中，两套试卷得分的变量名分别为A和B。 • 使用最简代码求均值、标准差的置信区间： • proc ttest data = sjcj; • run; • 代码运行结果给出两个变量在95%置信水平下的均值、标准差的置信区间，以及对原假设μ0= 0所作的t检验的p值，如图所示。

3. 单样本总体均值的假设检验 • 在例3-8中增加原假设选项以及置信水平，代码如下： • proc ttest h0=70 alpha = 0.01 data=sjcj; • var A; • run; • 代码运行结果除了给出变量A在99%置信水平下的均值、标准差的置信区间外，还给出对假设μ0 = 70，所作的t-检验的p值，如图3-15所示。 • 结果显示t统计量的p值 = 0.5734，不能拒绝（57.34%的把握）原假设：均值 = 70。

4. 配对两样本均值的假设检验 • 在例3-8中检验两套试卷有无显著差异，代码如下： • proc ttest data=sjcj; • paired A*B; • run; • 代码运行结果给出了对原假设μ1 – μ2 = 0所作的t检验的p值，如图3-16所示。 • 结果显示t统计量的p值 = 0.0005 < 0.05，因此拒绝原假设。说明两套试卷有显著差异。

5. 独立两样本均值的假设检验 • 过程TTEST还可以用于进行独立双样本均值比较的t检验法。它的用法为 • PROC TTEST DATA = <数据集名>; • CLASS <分组变量名>; • VAR <分析变量名列>; • RUN; • 使用这一格式要求将两个样本中被比较均值的变量的观测值记在同一分析变量下，不同的样本用另一个分类变量的不同值加以区分，而且分类变量只能取两个值，否则将报错。

【例3-9】仍然考虑例3-7中的样本数据。假定其中数据使用如下数据步存放在数据集zzcpsj中：【例3-9】仍然考虑例3-7中的样本数据。假定其中数据使用如下数据步存放在数据集zzcpsj中： • data zzcpsj; • input f g$@@; • cards; • 28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 2 • 37.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 2 • 36 1 31.7 2 37.2 1 26 2 38.5 1 32 2 • 34.4 1 31.2 2 28 1 30 1 • ; • run;

将两批工人的测量结果看作两个样本，但其数据都放在一个数据集之中，所需的时间值是记录在同一分析变量f之下，而两种方法的差别是由变量g的值加以区分的，所以g可作为分类变量。检验代码如下：将两批工人的测量结果看作两个样本，但其数据都放在一个数据集之中，所需的时间值是记录在同一分析变量f之下，而两种方法的差别是由变量g的值加以区分的，所以g可作为分类变量。检验代码如下： • proc ttest data=zzcpsj; • class g; • var f; • run; • 检验结果如图所示。

在检验中，先看其最后关于方差等式的检验结果，检验方差相等是用的F '统计量，其数值为1.29，相应的p值为0.6779＞0.05 = α，所以不能拒绝方差相等的假设。 • 在方差相等的前提下，检验均值差异使用Pooled方法，对应统计量的t值为2.16，相应的p值为0.0433＜0.05 = α，所以两种方法所需的时间是有显著差异的。 • 在异方差的情况下，使用Satterthwaite法检验均值的差异。

3.3 总体比例的区间估计与假设检验的SAS实现 • 3.3.1 总体比例的置信区间 • 3.3.2 单样本总体比例的假设检验 • 3.3.3 两总体比例的比较

3.3.1 总体比例的置信区间 • 【例3-10】2004年底北京市私家车拥有量已达到129.8万辆，位居全国之首，据业内人士分析其中国产中低档汽车的比例较大，为了估计目前北京市场个人购车的平均价格，调查人员于某日在北京最大的车市随机抽取36位私人消费购车者，得到他们所购汽车的价格，见下表。 • 表3-13 年底购车价格(单位：万元) • 根据以上调查数据，试以95％的置信水平推断该地区购买私家车在15万元以上的消费者占有的比例。

第三章 区间估计与假设检验